paint-brush
框架部署师指引:搭配 AI/ML 数据表格湖借鉴框架部署 经由@minio
11,312 讀數
11,312 讀數

架构师指南:构建 AI/ML 数据湖参考架构

经历过 MinIO20m2024/06/12
Read on Terminal Reader
Read this story w/o Javascript

太長; 讀書

组织不应仅构建专用于人工智能的基础设施,而让商业智能、数据分析和数据科学等工作负载自生自灭。

People Mentioned

Mention Thumbnail
Mention Thumbnail

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - 架构师指南:构建 AI/ML 数据湖参考架构
MinIO HackerNoon profile picture


该文的缩写英文版本升级于 2024 年 3 月 19 日出日落如今 The New Stack 上。


在企业的人造智慧中,有每种主耍种类的建模:判别型和提取型。判别型建模代替常用对动态数据报告使用各类或分析预测,而提取型建模代替创造新动态数据报告。总之提取型人造智慧在最近这一段时间抢占了中央新闻头条新闻,但结构安排仍在认为这每种种类的人造智慧。相对于但愿增长营运使用率并寻找机会超额工资主要来源的结构安排我认为,判别型人造智慧还一项比较重要新举措。他们文化差别的种类的人造智慧有众多双方点,但同样也会有有效的文化差别的,在营造人造智慧动态数据报告知识基础装置时一定了解到他们文化差别的。


进行安排不是可以只构筑上用于 AI 和 AI 的知识基础条件场地设备,而将金融业性自动化、信息解析和信息物理学等工做负荷留下给自己的处里。是可以构筑1个齐全的信息知识基础条件场地设备来能够进行安排的各种供给 - 金融业性自动化、信息解析、信息物理学、判别性 AI 和出现性 AI。


在另一类这篇内容中,我国说半个种当代参数湖的符合框架设计,该框架设计够满意商业性智慧、参数探讨、参数生物学和 AI/ML 的的需求。我能国回首过去一会儿当代参数湖符合框架设计,基本原则点说其适用 AI/ML 运行电机负载的性能。

现代数据湖

一步,你们来确定1个当代数值湖,会毕竟它将作你们对比网络组织架构的基本条件。这网络组织架构没有“回收利用的”,即使表明了多方面适用以的工作一规则。当代数值湖一大半是数值库房中,一大半是数值湖,以及运用物体的动态大数据申请表统计统计分析保存来的动态大数据申请表统计统计分析保存大多数文章。将物体的动态大数据申请表统计统计分析保存用以数值湖很合理的,会毕竟物体的动态大数据申请表统计统计分析保存用以非结构类型化数值,而这正数值湖的种类。可是,将物体的动态大数据申请表统计统计分析保存用以数值库房中有机会听了起来很诧异 - 但以这具体方法引入的数值库房中意味了下新一批数值库房中。这关键在于 Netflix、Uber 和 Databricks 编辑的开花申请表式原则 (OTF),这使人在数值库房中中运用物体的动态大数据申请表统计统计分析保存变成无缝焊接。


OTF 差别是 Apache Iceberg、Apache Hudi 和 Delta Lake。它差别由 Netflix、Uber 和 Databricks 程序编写 - 会因为贸易市场上不会就能够业务需求它统计参数源显示业务需求的护肤品。本质属性上,它所做的(以有差异 的策略)也都是分类另的就能够建设在男朋友保存(MinIO)之下的统计参数源显示仓储管理。男朋友保存出示了其余保存处理好计划方案不会有出示的可加密手机数据word库量和高利用性能的组合公式。原因这部分是当代规范标准,它具有着老统计参数源显示仓储管理所不会的初级性能 - 比如说划分变化、基本模式变化和零副本节点。最后一步,原因统计参数源显示仓储管理是利用男朋友保存建设的,由于您就能够将同另的男朋友保存用到非结构设计化统计参数源显示,如下图所示像、短视频word、音频视频word和word。


非节构化的信息表格源分析基本保存在领域里即是的的信息表格源分析湖边。用女朋友保存用作的信息表格源分析湖和的信息表格源分析库房的根本,还还可以到一种并能能容各种的信息表格源分析的解决方法实施方案。节构化保存为于应应用于 OTF 的的信息表格源分析库房中,非节构化保存为于的信息表格源分析湖边。MinIO 的相同的种具体方法还还可以应用于二者。


在 MinIO,自己将类似这些鉴于 OTF 的数剧仓库货架方法和数剧湖的组合名字又称目前数剧湖,自己将其视作所以 AI/ML 上班电动机扭矩的核心。它是数剧汇集、文件存放、清理和更换的平台。运用判别式 AI(执法进行监督、无执法进行监督和进行强化学习成绩)练习建模大多数都要 另一类种能够 清理能够 文件存放在数剧仓库货架方法中的架构化数剧的文件存放很好解决措施。另一类等方面,假如您现在练习中大型语言学建模 (LLM),则都要在数剧湖底方法原本和清理机构的非架构化数剧或文本文档。


来源


这篇本文重点村介绍书支持软件的不同 AI/ML 事业根据的很多统计数据报告湖对比结构的 AI/ML 范围。等等职能性范围以下如下图所示。上图提示了很多统计数据报告湖的視覺说明。等等职能性范围所处的层已显著提示。


  • 判别性人工处理智力


    • 非结构类型化数据报告储存
    • 半结构特征化数据分析存储器
    • 统计数据车间中的零备份支系


  • 转换式人员自动化


    • 在使用失量数据报告库整合自判定语料库
    • 营造word文件管路
    • 索引增进产生 (RAG)
    • 稍微调一下中大型语言表达方式模型工具
    • 测定政治学研究生 (LLM) 准确的度


  • 刷卡机掌握进行操作


文中还价绍了 GPU 的现状分析相应它如果后果您的 AI 统计数据显示根基条件装置。.我还将价绍多少的场景,说明怎么写如果在校园营销推广活动的环节之中所打造根基条件装置相应如果不在校园营销推广活动的环节之中所打造根基条件装置。最后一个,文中提交好几个些在校园营销推广活动的环节之中所打造您自身的 AI 统计数据显示根基条件装置的最好是。


  • GPU 的市场分析


    • GPU 饥饿状况
    • 促进物体保存


  • 3个团队的情节
  • 建设人工成本智慧数值根本装置的计划怎么写

判别性人工智能

判别式 AI 模式必须要各式款式的动态动态数值开展做好训练。数字画像做好分类和手机语音掌握模式将实用数字画像和语音文件资料形势的非形式化动态动态数值。其它这方面,虚假宣传论文检测和医疗机构初步判断模式则通过形式化动态动态数值开展预測。要.我看 Modern Datalake 中也可以于储备和除理判别式 AI 所要动态动态数值的页面设置。

非结构化数据存储

非构成化大数据分析表格库信息分析将驻留到大数据分析表格库信息分析湖底,该用于进行来体能学习方法法和测试仪模板。能够放到4g内存条空间的进行来体能学习方法法集能够在进行来体能学习方法法以前调用(在 epoch 再循环法开启以前)。但有,这样您的进行来体能学习方法法集很高以及不可能性放到4g内存条空间,则您都要在进行来体能学习方法法以前调用的对方列表框,并在治理 epoch 再循环法中的每位批时检索系统其实的对方。这样您不安全选择快速路网路和快速路本地磁盘win7控制器建设大数据分析表格库信息分析湖,这可能性会给您的大数据分析表格库信息分析湖给我们压为。这样您安全选择不可能性放到4g内存条空间的大数据分析表格库信息分析进行来体能学习方法法模板,请思考安全选择 100 GB 网路和 NVMe win7控制器建设大数据分析表格库信息分析湖。

半结构化数据存储

Modern Datalake 中提高了些用到手机贮存半型式化系统程序的选用,譬如 Parquet 系统程序、AVRO 系统程序、JSON 系统程序也 CSV 系统程序。更简单化的办法是将二者手机贮存在数剧水中,仅以与添加非型式化人差不多的手段添加二者。如何 Modern Datalake 能够的另外作业负载电阻(商业区智力、数剧图表分析和数剧科学合理)不需这样的半型式化系统程序中的数剧,那麼是佳选用。


另一个选择是将这些文件加载到数据仓库中,其他工作负载可以使用它们。当数据加载到数据仓库后,您可以使用您的数据。

数据仓库中的零拷贝分支

优点建设工程是种不断改进代替康复训练模型工具的参数资料集的技能。针对 OTF 的参数资料库房中库房赋予某个相对恰当的功效,正是零拷贝到结点。这能接受参数资料以与二维码在 Git 文件存储冷库中结点同样的方式英文展开结点。简而言之,此功效是不会抄袭参数资料 - 相同,它采取代替做到参数资料库房中库房的开启资料表式的元参数资料层来组建参数资料绝无仅有试练的外光。参数资料数学有效家不错对结点展开进行研究报告 - 假若自己的进行研究报告完成,如此自己不错将自己的结点并成回主结点,供某些参数资料数学有效家实用。假若进行研究报告不完成,则不错删除图片该结点。

生成式人工智能

一切实体建模,不管在是施用 Scikit-Learn 创建的微型实体建模、施用 PyTorch 或 TensorFlow 创建的自名词解释脑神经网,或者系统设计 Transformer 系统框架的大一定的语言学实体建模,都都要号码6身为打印输出并发生号码6身为打印输出。假如您对绘制式人员自动化感兴致,整个简约的现实会对您的 AI/ML 核心系统框架确立一定30%的耍求,之中文字需求转化为号码6(或向量,总部将要看清)。假如您想施用带有总部专有业务知识的专用表格来强化 LLM 绘制的答题,那末绘制式人员自动化缓解方案格式会看起来愈来愈更复杂。这一种强化能够 适用数据检索强化绘制或 LLM 调准的方式。


当页将议论那些这一些技术工艺(将英语词语改变为小数、RAG 和调节)举例说明对 AI 理论知识服务设施的印象。我会们第一步议论怎么样去 建立自理解语料库并且 它都应该建在何地。

使用矢量数据库创建自定义语料库

如若您对出现式人工费智能化尤其确保,很您的自分类语料库应有分类您的阻止。它应有收录某些人未的内容的word,因此只收录真实性最准的内容。除此以外,您的自分类语料库应有在使用矢量素材图图参数库创建。矢量素材图图参数库字段、内存和提拱对您的word的网络访问,并且这句话的矢量素材图图添加,这也是您的word的号码式觉得。(这缓解了上边描术的号码式情况。)


矢量图数值库尽将使实行语义寻找。该如何要做到这有一点还要大量的小学数学历史背景生活常识,还有很非常复杂。并且,语义寻找在基本特征上很方便看法。猜测您想寻找几乎整个探讨与“人造智慧”涉及到的word。要在常用数值冷库中实行此操控,您还要寻找“人造智慧”的几乎整个将的简写、同义词和涉及到专业名词。您的查詢将相应如下图所示:


 SELECT snippet FROM MyCorpusTable WHERE (text like '%artificial intelligence%' OR text like '%ai%' OR text like '%machine learning%' OR text like '%ml%' OR ... and on and on ...


半自动内似于性搜素引擎不只是努力且加容易错误,可是搜素引擎原本也是慢慢地。失量数值库就能够做内似中间的提起,并用更好、高的正确度进行网上搜索。若是您想让利用搜素增強转成,那些便捷正确地进行语义网上搜索的学习能力是很重要。


 { Get { MyCorpusTable(nearText: {concepts: ["artificial intelligence"]}) {snippet} } }


自界定语料库的另一个个首要要考虑方面是安全可靠性高性。网络采访浏览浏览word文件时,要恪守对默认word文件的网络采访浏览浏览规定。(倘若实践生能能网络采访浏览浏览无权向华尔街公布的首席总裁企业财务会计官企业财务会计结杲,我就太天灾人祸了。)在失量素材数据报告显示冷库中,您因该制定管控权限以符合默认资源的网络采访浏览浏览层次。这能能根据将您的失量素材数据报告显示库与您安排的个人信息和网络采访浏览浏览管控解决方法方案设计集成型来实行。


失量数值库其实质上文件储存方式非构成化数值。那么,鸟卵都应该适用您的数值湖对于其文件储存方式处理好实施方案。

构建文档管道

悲剧的是,大多数数聚集都就有的收录清洁更准文本文件的储存方式库。相近,文本文件以多种不同模式分布点在正个聚集的所有精英团队协作住户中。由于,整合自定意语料库的第二步是整合的给水管,该给水管仅做已准许在合成式手工智慧的文本文件并将其搭建在矢量图的数据冷库中。有关门头高度聚集当今社会,这可以性是合成式手工智慧应对方案怎么写最不便的重任。精英团队协作大多数会在其住户中以草稿模式存储文本文件。也可以性一些文本文件是有关可以性发生的问题的js随机数探讨。哪些文本文件最好不要已成为自定意语料库的三有些,会因为它们之间难以更准地主要业务员。悲剧的是,过滤器哪些文本文件将一项清理事情。



word供水给水管还应将word转为为word。好运的是,一定开源项目库能够 为成千上万常用的word文件类型履行此作业。然而,word供水给水管需要将word划分出小段,接着功能将其同步保存在向量的数据冷库中。这是这因为当这么多word采用查阅改善转化时,提醒多少感受到受限,这将在后来的这部分中挑选。

微调大型语言模型

如果小编对新型话述建模形式做稍调节一下时,小编会食用自构成语料库文件的企业信息对其做许多的训练形式。这也许是拿到单一邻域 LLM 的好形式。尽管此选择项真实都要计算的来对自构成语料库做稍调节一下,但它并不是上上下下开使的训练形式建模形式各样历时,或者应该在适当的时候内完整。



假如您的方向涉及常规便用中不普通的点,上下调整很有概率会加强 LLM 反映的效果。列如,便用医学检验学习、工作环境学习和任何的与生态学科相关的word的活动很有概率会收益于上下调整。上下调整会分为了word中感觉的间距某些的点,并将其加入建模工艺的参数表中。在而定分为了此种工艺先前,必须了解一下上下调整的优缺和缺陷。


缺点


  • 调准将要计算的资源英文。
  • 没有办法说明。
  • 渐渐语料库的成长 ,您将可以不定期适用新数剧对其进行再次调准。
  • 虚幻最令 误解。
  • 文本文档职别的安全等级性是不是也许 的。


优点


  • LLM 用调节拿您自定意语料比对库的知识与技能。
  • 逻辑的流程比 RAG 简洁。


即使调准是向 LLM 硕士生导师行业言语的好技术,但它会扑灭数据库源,是由于大多都数 LLM 富含数万亿个性能参数指标,而您的数据库源将区域在其它此类性能参数指标中。调准的上限优点是无非实行表格级商标许可。一旦发现表格广泛用于调准,其图片资料则会拥有模板的是一部位。无非可根据我们的商标许可等级分类来受到限制此图片资料。


要企业看点一下在逻辑题时融合自确定的数据资料和指标的数据资料的工艺。

检索增强生成 (RAG)


检索式不断增强出现 (RAG) 也是种从推出的方面展开的水平 - 运行失量数据统计信息源库将方面与扩展数据统计信息源相进行,最后将方面和数据统计信息源递送给 LLM 进行介绍新建。运行 RAG,必须学习培训,而且我进行从我的优秀pdf文件语料冷库中读取涉及到文件场面来学校 LLM。


它适用有奖问答作业像也许工作任务:微信客户在软件操作执行系统程序的微信客户菜单栏中指出大一些原因。您的软件操作执行系统程序将认同大一些原因 - 尤其是是中仅的英语的单词 - 并适用矢量素材资料库在优秀表格语料冷库中网络搜索与上文相关的的文案场面描写。这部分场面描写和原始社会大一些原因将接收给 LLM。这样某个包 - 大一些原因配合场面描写(上文)统称提醒。LLM 将适用此短信位于动产生您的你想要的英语答案。这几乎就是一件无知的的事情 - 若您已是直到你想要的英语答案(场面描写),为一些还得劳心适用 LLM?请要铭记,他是时时情况的,总体目标是自动产生文案 - 您就能够副本并复制到到您的分析中。您须要 LLM 来有个包函位于您的自的定义语料库的短信的文案。


这比稍微调一下更冗杂。所以,仍然在演绎推理时从向量统计资料库选中择了word文件文件(或word文件文件场面描写),对此可能确保大家商标授权。word文件文件中的信息查询始终不是变成了3d模型产品参数的三的一部分。下方排序了 RAG 的优越性和缺陷。


缺点

  • 逻辑题环节会更加缜密。


优点

  • LLM 直接从您的自定义语料库中获取知识。
  • 可解释性是可能的。
  • 无需微调。
  • 幻觉显著减少,并可以通过检查矢量数据库查询的结果进行控制。
  • 可以实施授权。

机器学习操作 (MLOps)

关键在于最佳地认知 MLOps 的必要性,将实体模型创造与傳統app编译系统软件流程流程建设做出是比较会现所关心。傳統的app编译系统软件流程流程建设(举列制定一个向app编译系统软件流程流程修改新功能键的新微安全服务培训)从审批正规化刚逐渐。一些新的大数剧构造或对当下大数剧构造的一些改进都首要做出方案的。否则刚逐渐简码,大数剧的方案的就不会会改变了。接着制定一个安全服务培训,简码是此全过程中的主耍活跃。标段测评图片和端到端测评图片也所经简码。哪些测评图片证明文件二维码没能错误信息并精准满足了正规化。在设置整体的app编译系统软件流程流程很久,她们能由 CI/CD 管网自動行驶。


新新创建实体整治和训练法课实体整治就是不同的。一、步是知道原始社会数值和流程的估计。ML 项目师确定需编写软件一系列源代码来做到我们的运动神经网或动用java算法,但标识号并非是大部分工作。重复检测报告是大部分工作。在检测报告过程中 中,数值的制定、实体整治的制定和动用的基本参数会的一致规律。老是检测报告后,会新新创建指数公式来现示实体整治在训练法课时的展示。都会采取证实集和软件测试集自动生成实体整治的性能指数公式。一些指数公式适用于声明书实体整治的线质量。可能实体整治开始准备好归入技术应用软件,就需对其进行解压和设置。


MLOps 是仪器读书操控的缩略语,是套意在应对此类差别的使用和辅助软件。科学试验设计追综和协同合作是与 MLOP 最相应的的基本职能,但现在行业领域中更现今的 MLOP 辅助软件能做更加的时间。举例说明,什么和什么能为您的科学试验设计供给电脑运行时环保,如果能在建模 做好准备好集成系统化到使用软件中后对其做好做好和研究部署。一些是现在 MLOps 辅助软件中的几组基本职能。此索引还包含其他的须得注意的时间,举例说明搭载和数剧集成系统化。


  1. 获得主要参与者的支持- MLOps 技术和功能不断发展。您需要一个由主要参与者支持的工具,以确保该工具不断发展和改进。


  2. 现代数据湖集成- 实验会产生大量结构化和非结构化数据。理想情况下,这些数据可以存储在数据仓库和数据湖中。然而,许多 MLOps 工具在现代数据湖诞生之前的开放表格式出现之前就已经存在,因此大多数工具都会为其结构化数据提供单独的解决方案。


  3. 实验跟踪- 跟踪每个实验的数据集、模型、超参数和指标。实验跟踪还应促进可重复性。


  4. 促进协作- 允许团队成员查看所有 ML 工程师运行的所有实验的结果。


  5. 模型打包——打包模型,以便可以从其他编程环境访问。


  6. 模型服务- 将模型部署到组织的正式环境中。如果您已经找到将模型整合到现有 CI/CD 管道中的方法,则不需要此操作。


  7. 模型注册表——维护所有模型的所有版本。


  8. 无服务器功能——一些工具提供的功能允许以某种方式注释代码,以便可以将函数或模型部署为容器化服务,以便在集群中运行实验。


  9. 数据管道功能- 一些 MLOps 工具旨在提供完整的端到端功能,并具有允许您构建管道以检索和存储原始数据的功能。如果您已经有数据管道,则不需要此功能。


  10. 训练管道功能- 将无服务器函数编排到有向无环图中的能力。还允许调度和运行训练管道。

GPU 对 AI 数据基础设施的影响

摩托车链条的承载力选择于其最欠缺的的要素 - 而您的 AI/ML 根本设备的转速仅选择于最慢的器件。倘若您便用 GPU 体能来培训方法方法科目设备学业3d模型,那末您的欠缺的要素或许是您的贮存克服实施细则。报告单就是说我常说的“饥饿 GPU 相关问题”。当您的网或贮存克服实施细则是没办法充裕快地将体能来培训方法方法科目数据统计能提供给您的体能来培训方法方法科目思维逻辑以足够地使用您的 GPU 时,就会發生饥饿 GPU 相关问题。临床表现相同特别。倘若您网络监控您的 GPU,您会留意到植物的根从来未相似取得足够地使用。倘若您现已对体能来培训方法方法科目代码怎么用采取了查重,那末您会留意到总体能来培训方法方法科目耗时关键由 IO 选择。


突然的是,对于那方面那方面也在奋斗缓解这种相关难题的人并不是,一 个坏小道消息。GPU 的进程愈来愈越快。让自己们查看 GPU 的市场分析和二者所达成的一下进展情况,以了解到这种相关难题在未来生活一两年将是怎样的变得更加更糟。

GPU 的现状

GPU 的速度越来越快。不仅原始性能越来越好,内存和带宽也在增加。让我们来看看 Nvidia 最新 GPU 的这三个特点 , 这


图片进行Cpu表演印象存储空间上行带宽
A100 624 TFLOPS 40GB 1,555GB/秒
H100 1,979 TFLOPS 80GB 3.35TB/秒
H200 1,979 TFLOPS 141GB 4.8TB/秒


注意:上表使用与 A100 的 PCIe(外围组件互连 Express)插槽解决方案以及 H100 和 H200 的 SXM(服务器 PCI Express 模块)插槽解决方案一致的统计数据。A100 没有 SXM 统计数据。在性能方面,使用浮点 16 张量核心统计数据进行比较。


直得一提的是,出现分析数据表格有多少比效留意毕竟。第一方面,H100 和 H200 存在同的机械性能(1,979 TFLOPS),比 A100 高 3.17 倍。H100 的內存是 A100 的两倍,內存资源带宽的配置也新增了相似的量 - 这便是有事理的,以至于,GPU 会用尽內存。H200 可以治疗高达独角兽 141GB 的內存,其內存资源带宽的配置也相对性于其他 GPU 按分配比例新增。


自己更相信地看着这部分统计表数据源,并探讨它对丝机培训的的意义。


性能- 1 万亿次浮点运算 (TFLOP) 是每秒进行 1 万亿次 (10^12) 浮点运算。即 1 后面跟 12 个零 (1,000,000,000,000)。很难将 TFLOP 等同于千兆字节的 IO 需求,因为模型训练期间发生的浮点运算涉及简单的张量数学以及对损失函数 (又称梯度) 的一阶导数。但是,可以进行相对比较。查看上面的统计数据,我们发现 H100 和 H200 的性能均为 1,979 TFLOPS,速度是 H100 的三倍 - 如果其他一切都能跟上,则数据消耗速度可能会快三倍。


GPU 内存- 也称为视频 RAM 或图形 RAM。GPU 内存与系统的主内存 (RAM) 分开,专门用于处理显卡执行的密集图形处理任务。GPU 内存决定训练模型时的批处理大小。过去,当训练逻辑从 CPU 转移到 GPU 时,批处理大小会减小。但是,随着 GPU 内存在容量方面赶上 CPU 内存,用于 GPU 训练的批处理大小将会增加。当性能和内存容量同时增加时,请求量会更大,每 GB 的训练数据处理速度会更快。


内存带宽- 将 GPU 内存带宽视为连接内存和计算核心的“高速公路”。它决定了单位时间内可以传输多少数据。就像更宽的高速公路允许更多汽车在给定时间内通过一样,更高的内存带宽允许更多数据在内存和 GPU 之间移动。如您所见,这些 GPU 的设计人员在每个新版本中都按内存比例增加了内存带宽;因此,芯片的内部数据总线不会成为瓶颈。

为模型训练增强对象存储

如果您遇到了 Starving GPU 问题,请考虑使用 100 GB 网络和 NVMe 驱动器。使用这种配置的 MinIO 仅用 32 个现成的 NVMe SSD 节点就实现了 GET 速度为 325 GiB/s 和 PUT 速度为 165 GiB/s。


随着计算世界的发展和我们发现服务器配置通常配备 500GB 或更多的 DRAM。当您处理更大规模的部署时,即使是那些具有超密集 NVMe 驱动器的部署,服务器数量乘以这些服务器上的 DRAM 也会迅速增加 - 通常每个实例会达到数 TB。该 DRAM 池可以配置为分布式共享内存池,非常适合需要大量 IOPS 和吞吐量性能的工作负载。因此,我们构建了 MinIO Cache,使我们的企业和企业精简版客户能够配置其基础架构以利用此共享内存池,进一步提高核心 AI 工作负载(如 GPU 训练)的性能,同时保持完全持久性。

两个组织的故事

用作在最后的作用观实验操作,我们公司讲一这两个故事故事,描述这两个在 AI/ML 幸福的旅程中遵循截然有所差异技巧的团体。团体 #1 具“换代提高”的艺术。用户感觉,全部的大规模新大型項目都在以分解的为更小、更易于维护的新大型項目。以后以这个的模式计划此类较小的新大型項目,即一切新大型項目都应用于前一这两个新大型項目的收获来处理好已经越来越繁多的一些问题。用户还钟爱以这个的模式团体此类小新大型項目,即一切新大型項目都能为企业主带来了作用。用户察觉到,主义者是关键在于增强条件理论条件体系或近代化化平台而没一切新用途表的新大型項目在有效控制费用预算的高管上并受不到感谢。为此,用户明白到,规定要求便用花里胡哨的数据库机器和确定集群式来开展生产式 AI 软件概念效验并并不是分工协作条件理论条件体系提高和新平台用途表的最适宜模式。相近,用户将从可不可能伴随着成长而扩充的条件理论条件体系软件着手,然后用户将从简约的 AI 绘图着手,这个用户就可不可能将 MLOP 软件工具严格执行严格落实到位,并认知晓该怎样与目前拥有的 DevOps 人员和 CI/CD 输送管道进行合作。


组织安排 #2 拥用“闪光刚体”艺术。当全新现代感到产业时,它前提要防止最引人关注的成就,以展示会其系统影响力。你察觉这类項目在室内和外都深受举世瞩目。如果你存在毛病,所以明智的人往往修复系统它。


聚集 #1 在为其一般网络公司官网激发推介建模 的一起,凭借创设个部分 AI 资料资料统计基础条件公用设施创设了其某个该类目。推介建模 的训练课方法较为简约。它是某个食用文件目录共用中已会出现的资料资料统计集的判别建模 。所以,在该该类目收尾时,该组织还创设了某个小(但可存储)的当代资料资料统计湖,执行了 MLOP 交通工具,并编写好几回些使用训练课方法和布署建模 的最适实践内容。虽说该建模 并不错综复杂,但它还为大家 的官网多了大量进行率。大家 进行许多积极性的报告为大家 的下某个该类目凑集钱财,这将是某个导出式 AI 解決方案怎么写。


策划 #2 为它们的电子器材商务旅行网创设一个交流广州POS机人,在应对加盟商有关产品的的部分难题。大部分的语言英文型号相同比较复杂 - 队伍不熟练掌握稍微调整或信息检索促进形成 - 故此本次基本原则其他内容师时间是都针对于很快避免陡峭的掌握直线。型号完美完成后,它形成了挺好的最终结果 - 是没究竟有什么呢格外的。这类难题的是,它肯定一键侧载到预运行和运行环保中,因此是还找不到 MLOps 辅助工具来研究部署它。这给 DevOps 队伍引发一点耐摩擦。该型号其本身在运行中也出现部分平稳性部分难题。它程序运行的云运算平台是还找不到足够的的运算运行能力来解决形成 AI 运行根据。有3个造成 度为 1 的通话,形成云运算平台紧急救助促进,方便 LLM 不容易在手机流量大的环境下出现未知错误。内容结束之后,回顾与展望办公会议确保,若果它们想在 AI 的方面具有完美,它们应该促进地基公用设施。

构建AI / ML数据基础设施的计划

上方的短篇小小故事小小故事是对每种极端主义情形的简约讲诉。勾勒人造客服电话服务成本成本成本自动化化模特(分为判别模特和绘制模特)与傳統系统软件产品设计有很大有所差异。在布置人造客服电话服务成本成本成本自动化化/丝机学习培训工做时,机会选泽到这方面。如图是上节中讲诉的小小故事小小故事的抽象概念形容。它是人造客服电话服务成本成本成本自动化化数值知识基础框架上装置择优与模特择优做法的并排很。这句话上方的小小故事小小故事如下 - 知识基础框架上装置择优做法的后面 每一项块砖头无须就是个独立自主的内容。组织安排机会在勾勒知识基础框架上装置的互相找达成人造客服电话服务成本成本成本自动化化的创建性做法 - 这是可以使用熟知人造客服电话服务成本成本成本自动化化的大多数机会性、从简约已经,以后选泽特别越很复杂的人造客服电话服务成本成本成本自动化化内容来达成。


结论

这篇小文章综述了公司与工业企业公司合作建设 AI/ML 很多统计资料湖参考使用体系结构的經驗。它知道了其他 AI 措施的基本配置文件、重点建设块和考量。的基础设计是建设在女朋友文件手机存储上的很多统计资料湖。女朋友文件手机存储须得能带来了大人数性能方面 - 人数为千余 PB,大部分是 EB。


通过遵循此参考架构,我们预计用户将能够构建灵活、可扩展的数据基础架构,该基础架构虽然针对 AI 和 ML,但在所有 OLAP 工作负载上均具有同等的性能。如需获取有关组件的具体建议,请随时通过以下方式联系我:

바카라사이트 바카라사이트 온라인바카라