据数据统计,目前我国公开发布大模型超80个,大模型发展“如火如荼”来形容。大模型的兴起让 AI 有了从手工作坊走向工业化大生产的机会,然而大模型开发门槛高,算力资源消耗大,如何充分发挥大模型的潜力,普惠 AI,更好地各行各业智能化升级服务?
7月7日,在华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0,为AI重塑千行百业提供新的范式。
01 分层耦合设计,“5+N+X”三层架构
当下国内科技企业争相布局AI大模型,而华为早在2019年左右,开始立项研发盘古大模型,在2021年4月,首次发布盘古基础大模型。随后陆续发布盘古行业大模型系列,如在2021年9月发布的盘古药物分子大模型,2022年6月发布的盘古矿山大模型,同年11月发布了盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型等。
盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构,从下往上即为基础大模型、行业大模型、场景模型的架构,可以支撑我们解决通用性问题、行业性问题和细分场景的问题。
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为用户训练自己的专有大模型。
L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为用户提供“开箱即用”的模型服务。
从中我们看到,盘古大模型采用完全的分层解耦设计,帮助不同行业快速、灵活适配需求。张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。”
02 盘古大模型“飞入”各行各业,普惠AI
如何将AI大模型走向大规模、可复制的大工业时代?盘古大模型3.0注重实际行业难题,真正做到融入千行百业,用AI技术解决其中的问题,真正做到让 AI 惠及全社会。
如在煤矿领域,煤矿环境恶劣,危险程度高,如何用AI来替代人从事危险工作、重复劳动,从而保障人员和生产的安全?盘古矿山大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。目前,盘古矿山大模型已经在全国8个矿井规模使用。
在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。
在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型可大幅提升药物研发效率,助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。
在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。将应用于航空/航天、海运、农业、交通出行、新能源等行业产生更多价值。
在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。
在金融领域,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。
在制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。
除了以上案例外,在部署场景上,盘古大模型3.0提供基于公有云和混合云的综合方案来适应不同行业的部署需求。总的来说,盘古大模型有效解决传统AI开发的难题,其泛化性能高、高效样本标注、精准度高、可解决碎片化问题、降低AI开发门槛,助力千行百业。
03 盘古大模型深度融合华为云产品
如盘古大模型赋能华为云CodeArts代码工具,发布智能编程助手CodeArts Snap。该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,现场演示了CodeArts Snap可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署。
通过盘古大模型赋能MetaStudio数字内容生产线,打造了盘古数字人大模型,提供模型生成和模型驱动两大服务,并已经使用了20万小时音视频数据进行了预训练。基于这两大服务,开发者可以快速生成和驱动数字人模型,赋能在线教育、文娱直播、企业会议等行业应用,让每个企业员工实现“数字人自由”。例如,用户只需在华为云MetaStudio的服务页面上传20秒的个人视频,就可以快速生成个性化的数字人讲解视频,过去3个研发人员3天完成的工作,现在只需要3分钟就可以完成。
通过本次盘古大模型3.0的发布,可以看到华为云在技术和应用上赋能业务创新,不断夯实行业智能化底座,助力千行百业智能升级。
原文链接:https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/131645218?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170018760316777224492052%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=170018760316777224492052&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-27-131645218-null-null.nonecase&utm_term=AI%E6%B3%95%E5%BE%8B%E5%92%A8%E8%AF%A2
hey there and thank you for your information – I have definitely
picked up something new from right here. I did however expertise several technical points using
this website, as I experienced to reload the site lots of times previous
to I could get it to load properly. I had been wondering if your hosting is OK?
Not that I’m complaining, but slow loading instances times will very frequently affect your
placement in google and can damage your quality score if ads and marketing with Adwords.
Anyway I am adding this RSS to my e-mail and could look out for a lot more of your respective intriguing content.
Ensure that you update this again very soon.. Escape room