对话百度吴甜:驱动“AI规模化” 今年是大模型落地关键年

  新浪科技讯 4月17日上午音讯,随着数据井喷、算法提高以及算力的打破,效果好、泛化才能强、通用性强的预训练大模型(简称“大模型”),已成为人工智能开展的新方向。近日,在2021百度认知AI创意赛“AI创意派”决赛现场,百度初次将文心大模型才能向大众开放,让每一位对AI感兴味的人,都可以自上手运用大模型停止创意设计开发。   决赛现场,百度集团副总裁吴甜列席并围绕大模型行业趋向、产业价值、落地效果,分享了百度文心大模型的停顿。在与新浪科技等媒体沟通中,吴甜指出,数据、算法、算力的开展,为人工智能技术带来了新的机遇,预训练大模型正驱动着人工智能的规模化使用,往年是文心大模型使用落地关键年。   大模型正驱动AI规模化使用   近年来,国际内科技巨头如谷歌、微软、英伟达、百度等,纷繁在AI大模型范畴展开相应探究。频频取得国际内科技巨头关注的面前,大模型真正的魅力在于——人工智能作为新一轮科技反动和产业革新的重要驱动力气,它需求在各行各业深度地绑定交融,才干真正成为驱动产业转型晋级的关键力气。   但是,受制于不同行业规则悬殊,以及支撑特定场景AI模型训练的数据获取难、算力及人力本钱初等要素,目前大少数的人工智能技术,往往只能被多数企业开发并用于处理特定范畴成绩,难以停止场景迁移和规模化复制,通用性和普适效果差。   大模型的呈现,大幅降低了人工智能的使用门槛。其经过集中提供通用算法模型,打造技术底座,让大少数企业可以“站在巨人的肩膀上”, 使标注数据更少、开发效率更高、使用本钱更低。   据吴甜引见,目前百度文心大模型已成为产业级知识加强大模型,包括NLP(自然言语了解)大模型、CV(计算机视觉)大模型、跨模态大模型,既有根底通用的大模型,也包括面向重点范畴、重点义务的大模型,以及丰厚的工具与平台。其中,多个大模型达全球抢先程度,例如全球首个百亿参数中英文对话大模型PLATO-XL、首个聚焦中英文场景大规模 OCR 构造化预训练模型 VIMER – StrucText等。   与此同时,为进一步降低AI使用难度,文心大模型还经过与百度飞桨等开源框架结合,为开发者提供了成套的工具平台,配套易上手的大模型开发、轻量化、部署工具,让各行各业的开发者都能低门槛地完成AI的使用。   “百度大模型与国产深度学习框架交融开展,打造了自主创新的AI底座,真正发扬大模型驱动AI规模化使用的产业价值。”吴甜表示。   往年是大模型产业落地关键年   据吴甜引见,百度文心大模型的降生可追溯到2019年3月,事先百度发布的中国首个正式开放的预训练模型,便是文心大模型的ERNIE1.0版本。该模型不时晋级并获得打破,2021年7月,作为首个在百亿级预训练模型中引入大规模知识图谱的模型,ERNIE 3.0刷新了五十多个中文NLP义务基准。2021年12月,ERNIE 3.0晋级为全球首个知识加强千亿大模型,模型数量打破2600亿。   从行业角度来看,大模型的参数规模是评价一个模型好坏的关键目标,参数越大普通来说意味着大模型具有更多的才能,泛化性、通用性也愈加强。目前,文心大模型参数规模到达2600亿。“从十亿级参数到千亿级,可以明白看到模型规模增长和训练数据添加带来了明显效果提升。”吴甜表示。   当然,一味地比拼参数,并不是权衡大模型优劣的独一规范。模型质量、算力大小等软硬件协同才能,以及大模型的工程落地才能,也是重要的评价维度。   据吴甜引见,文心大模型最大的特点是“知识加强”。传统大模型只从海量的文本中学习,只能融会贯通文本的规律,并不能从实质上了解世界是怎样运转的,在详细使用时,一些触及逻辑推理和认知的义务表现较差。为补偿这一缺陷,百度引入了知识图谱,经过“知识加强”的办法,将数据与知识交融,提升了文心大模型的通用性。   在落地运用方面,目前文心大模型已大规模使用于百度外部的各类产品,包括搜索、信息流、小度智能屏、百度地图等。与此同时,文心大模型经过飞桨开源开放平台、百度智能云等,已赋能到工业、动力、金融、通讯等行业,团体、企业开发者数量已超越6万。   “在保险范畴使用中,文心大模型的智能解析才能,能使文本处置效率提升30倍;在人力资源范畴使用中,文心大模型能完成候选人信息智能分类,模型辨认精确率到达99%。”吴甜表示,据他引见,往年是文心大模型产业落地关键年,将来百度还将不时去降低门槛,让这一系列的创新技术能普惠到更多的人与行业。   在2021百度认知AI创意赛“AI创意派”决赛现场,百度开放了ERNIE 3.0的才能,让每位对AI感兴味的人,都可以亲身上手运用大模型停止创意开发。据引见,该竞赛自2021年10月正式开启,目前已吸引近2000名选手参与,搜集超越300份创意方案。(周文猛)

发表评论