当前位置:主页 > 新闻资讯 > 行业新闻 >

在线大数据 / AI竞赛实训平台深度技术剖析

时间:2022-04-19 15:45

亚博yabo888vip网页版登录 - 亚博yabo

本文摘要:12月24日晚,智领云第五次社群图文技术直播如约而至。本次直播由智领云云平台部门司理Jason为大家分享BDOS在线大数据/人工智能竞赛及实训解决方案,主要内容包罗行业现状和痛点,BDOS在线大数据/人工智能竞赛及实训解决方案的详细先容,以及对乐成的行业落地案例的分享。一、行业现状与痛点当前的大数据技术已经趋于成熟,在数据存储、数据分析、数据出现和数据应用等方面,已经形成了一整套技术框架,相关的技术生态也在不停的完善当中。

亚博yabo888vip网页版登录

12月24日晚,智领云第五次社群图文技术直播如约而至。本次直播由智领云云平台部门司理Jason为大家分享BDOS在线大数据/人工智能竞赛及实训解决方案,主要内容包罗行业现状和痛点,BDOS在线大数据/人工智能竞赛及实训解决方案的详细先容,以及对乐成的行业落地案例的分享。一、行业现状与痛点当前的大数据技术已经趋于成熟,在数据存储、数据分析、数据出现和数据应用等方面,已经形成了一整套技术框架,相关的技术生态也在不停的完善当中。但不行否认的是,企业以及教育行业在使用大数据时,仍面临着以下诸多的难题。

1、高成本、长周期:从零搭建大数据/人工智能体系用于培训、角逐或者企业内部实验,需要经由选型、立项、治理等庞大历程,效果难以立竿见影;2、大数据专业团队难寻:大数据及人工智能组件多、依赖庞大、设置繁复,在企业/机构开展焦点业务之前,需要先花鼎力大举气组建大数据的专业团队,难免造成商业重心偏移;3、系统僵化、难维护:传统企业自建大数据平台无法智能举行集群动态运维和资源算法分配的治理,对稳定性、体验性、按需扩展性要求高的实训、角逐、实验等场景难以对应支持;4、模式单一,难通用:传统业务模式依赖手动单一组件的安装和使用,不能通过即开即用的方式任意组合大数据组件和数据科学工具来举行课程、赛制的研发与迭代,由此限制了大数据整体认知价值的提升。二、BDOS在线大数据/人工智能竞赛及实训解决方案,可以解决哪些问题?针对以上痛点,BDOS在线大数据/人工智能竞赛及实训解决方案可以资助教育行业以及企业挣脱种种难题。首先,对于科研机构来说,该解决方案能为科研机构提供易用、情况稳定、连续升级的在线机械学习及人工智能实验教育情况和完整服务,保证研究结果易分析,实验数据全防护。

其次,对于高等教育及大专院校,该解决方案能为高校、大专院校提供即开即用的大数据人工智能课程的实训体系,模拟竞赛情况。最后,对于企业来说,可以为企业内部员工提供大数据人工智能学习与培训的情况。三、BDOS在线大数据/人工智能竞赛及实训解决方案先容该解决方案是一套企业、高校和科研教学业务的大数据/人工智能整体认知提升及角逐解决方案。

该方案资助客户快速搭建多租户大数据及人工智能使用情况,提供协同式在线数据科学研发、实验及治理的能力,包罗全面的大数据/人工智能实战课程,竞赛治理,研发体系,灵活集成种种新型工具,提供在线编程、研发、集成情况,满足企业、高校和科研教学业务需求。四、方案组成基于以上行业现状,通过BDOS形成一套在线大数据/人工智能竞赛及实训解决方案,以解决和满足现在行业存在的痛点和需求。

亚博yabo888vip网页版登录

解决方案的架构图如下:自下而上来看,这套解决方案包罗以下层面:IT基础设施层(IaaS):BDOS支持搭载在客户的公有云、私有云或者混淆云情况上。应用云平台(PaaS):支持对大数据平台及云原生应用的统一调理,统一运维,将资源的分配粒度从主机级降到应用级,差别机构和差别应用在资源隔离的保证下宁静共享数据以及资源池,增加系统治理的灵活性,提高资源使用率。容器化大数据平台:提供大数据系统(Hadoop、Hive、Kafka、Spark)及应用敏捷公布和按需弹性集群扩展、尺度化的大数据组件及应用(ETL、机械学习、人工智能)的开发/测试/生产情况、高资源使用率和多租户数据隔离能力。

数据集成开发平台:提供数据集成、数据堆栈建设、数据开发、数据服务、应用调理和全局多租户治理能力。协作式数据科学分析及实验平台:提供数据科学分析工具箱、数据接入、模型治理、算法库治理、协作开发、竞赛、实验项目治理能力。大数据及人工智能实训平台:提供种种大数据、人工智能和机械学习实训课程情况及内容治理能力。

业务层面:基于实验和实训平台,业务应用包罗课题计划、教学治理、课程治理、课件治理和结果评估等。该解决方案提供以上这些开箱即用的平台体系,我们再回过头去看前面枚举的行业痛点和需求,都可以获得有效地解决和满足。五、具有代表性的乐成案例分享1、中软协人工智能应用挑战赛配景先容为了推动软件与智能应用工业的生长,促进 IT 类专业技术人才造就,进一步落实中国软件行业校园招聘与实习公共服务平台精准求职、精准招聘的目的,中国软件行业协会智能应用分会提倡了2020人工智能应用挑战赛,旨在发挥各自的资源优势、渠道优势、履历优势,将高校招录研究生和企业招聘工程师的行业尺度融入大赛,配合推动高校人才造就与就业,推动青少年盘算机基础学习,造就青少年对盘算机学科的兴趣,连续为软件行业输送具有创新能力和实践能力的 IT 人才,适应人工智能工业的快速生长,对接经济社会人才需求,促进学生在人工智能研究与设计、开发与应用方面的创新能力造就,促进相关专业的应用型人才造就与课程体系厘革,促进创新教育领域的产教融合、产学协同育人。

方案设计挑战赛的基本信息如下:角逐分为两个阶段,初赛阶段并发用户数最约莫2000人,决赛阶段并发用户数最约莫200人初赛阶段每个用户需提供2核/8G内存的CPU算力资源,决赛阶段每个用户需提供8核/32G内存/1GPU的算力资源角逐连续15天,用户的日活跃时间不牢固,期间任意时间选手均可登录平台举行算法开发和提交运行角逐需提供Python、TensorFlow、Spark、R等算法开发的情况角逐平台需在公有云情况搭建,面向公网开放方案落地的难点有:1、公有云成本控制:如果根据全量用户来购置资源,成本过高(初赛阶段资源共需63台64C 256G机械 , 一周近15万;决赛阶段资源共需200台8C 32G GPU+25台64C 256G机械,一周近30万)思量用户并发量周期性颠簸,根据一定比例来购置包月机械和按量付费机械(如何快速买入和释放)2、运维人力有限:如何保证集群运行稳定如何支撑集群弹性伸缩(手动or自动)初赛和决赛之间如何快速切换情况方案落地最终,我们通过使用BDOS人工智能竞赛及实训解决方案案在公有云情况搭建了本次挑战赛的赛事平台并保证了赛事的乐成举行,以下是一些数据统计:平台治理了90+公有云节点,运行了600+应用Pods,运行了1000+容器实例,建立了3000+的持久化存储卷,角逐期间平台稳定运行决赛阶段集群资源使用率到达70%+,集群算力使用率高共触发了400+的集群弹性伸缩运动,基础设施弹性伸缩能力强,弹性成本占比高整个角逐项目只用1位云工程师运维支撑,运维成本低从这个案例中,我们看到了BDOS人工智能竞赛及实训解决方案的稳定结实,弹性伸缩,灵活扩展和按需使用等优势。2、北京医保局医保数据竞赛配景先容北京医保局希望通过举行本次竞赛,勉励具备人工智能、大数据分析与挖掘等“高精尖”科技的高新技术企业、高校、研究机构等到场医疗保障治理服务,将成熟的创新科技技术转化为实践;增强政商战略互助,优选一批切合医保创新生长需要的新技术纳入医疗保障治理服务场景应用示范,不停完善该市医疗保障治理服务创新能力体系;促进“高精尖”工业生长,推进创新技术转化为实践产物并落地实施,形成线上线下融合、相互促进生长、规范宁静高效的医保与高科技工业配合生长格式。方案设计数据竞赛的基本信息如下:角逐有12个参赛队伍,分为赛题A和赛题B,两道赛题得分综合盘算最终结果赛题A数据集量级约为10GB,每个用户需分配16核/128GB内存算力;赛题B数据集量级约为600GB(压缩前),每个用户需分配48核/256GB内存算力赛题A、B均需支持Spark盘算引擎,赛题A接纳Spark当地运算提交模式,赛题B接纳Spark集群运算提交模式方案落地的难点有两方面:1、实施情况:客户私有云情况且关闭网络,所有系统需要从零搭建,隔离情况下镜像构建(选手现场提出了安装三方算法库的需求)难题虚拟化平台由三方提供,大数据情况搭建后的性能保证是不确定的2、数据处置惩罚和资源公正性:由于赛题B的数据集是上百GB级别,当地算力盘算无法满足要求(没法提供256GB内存的单机且不现实),必须提供集群模式的Spark运行情况多个参赛团队共用一个大数据集群,需要确保盘算资源公正性和数据宁静,制止单个团队无限制使用集群算力而其他团队无法拿到资源的情况数据需要脱敏和抽样,但客户侧没法独立完成,只能导入到大数据系统中后再做数据处置惩罚方案落地最终,我们的BDOS在线大数据/人工智能竞赛及实训解决方案在这个项目中乐成落地,从零搭建到角逐开始,该项目实施周期约3周左右,实施和运维人力投入约2人。

其中,BDOS容器化大数据平台提供了开箱即用的Hadoop、Hive和Spark的主流大数据组件,通过BDOS数据集成开发平台,我们的实施人员配合客户侧能够高效地完成数据收罗、压缩、脱敏和抽样,使用BDOS的数据宁静和多租户特性,为每个角逐团队分配了指定的盘算资源和独立的数据存储空间,保证了集群模式盘算的资源公正性和数据宁静性;各参赛团队的选手通过上层的协作式数据科学分析及实验平台可以快速获取处置惩罚后的数据集,可以很利便地举行在线编写、调试和提交Spark法式。五、BDOS在线大数据/人工智能竞赛及实训解决方案的优势1、完整的产物体系:可以提供盘算机基础、数据库、储存、大数据、人工智能、机械学习以及大数据宁静等任意IT/大数据/人工智能情况,并提供连续不停地跟进技术革新、在线调整和情况升级设置;2、大数据平台能力:提供了大数据收集、储存、分析等数据服务,以及可视化的一站式平台,资助客户掌握大数据焦点能力,使用大数据分析不停迭代自身商业模式;3、按需建设及使用:快速按需实施,集群弹性扩展以应对突发的实训、科研及角逐盘算场景;同时在需求淡季能自动降容来确保资源使用不浪费;4、优秀的性能:夯实的系统基础,提供高可用且性能优秀的平台;能够应对随时增长的应用容量,而且保证高效的资源使用率,完善的多用户治理,细粒度的资源共享,充实使用硬件资源;5、协同及灵活的横向扩展:数据科学家协同平台,能轻松扩展至TensorFlow、Pytorch、Zeppelin的学习和实验平台;同时对新组件/系统的支持也很是的轻松,Presto、Cassandra、MongDB等都能够轻易在原有的解决方案上举行扩展。6、宁静稳定:提供全程操作审计和监控;用户宁静组设置;统一授权/验证,满足企业焦点数据的宁静诉求,制止数据资产泄露,保障宁静与可用性。

六、总结通过本次分享,我们先容了BDOS在线大数据/人工智能竞赛及实训解决方案及其在行业乐成落地的案例,让大家对于相关行业的方案落地有了一定的相识,以下为BDOS在线大数据/人工智能竞赛及实训解决方案的优秀落地案例,接待大家点击阅读:以赛促学,为用而训,智算之道探索创新应用型数据人才造就新模式 北京数智医保创新竞赛,智领云BDOS牢筑竞赛“地基”。


本文关键词:亚博yabo888vip,在线,大,数据,竞赛,实训,平台,深度,技术,剖析

本文来源:亚博yabo888vip网页版登录-www.cs-zs.com