如何破解大模型选择困难症？新华网评测：文心一言多项得分高，产业落地规模大-乌托邦网络

活动中心视频教程测试IP汇总控制台宝塔面板忘记密码

产品中心

云计算服务

香港云服务器 HOT

美国云服务器

日本云服务器

韩国云服务器

CDN服务

美国高防CDN 500G防护

香港高防CDN 100G防护

国内高防CDN 1TB防护

CDN服务定制定制无敌防御

DDOS 防护

美国高防服务器 200G

香港高防服务器 100G

日本高防服务器 100G

韩国高防服务器 100G

虚拟主机

基础型虚拟主机

促销型虚拟主机

增强型云虚拟主机

豪华型虚拟主机

其它服务

域名注册

已备案域名注册 HOT

模板建站 HOT

301海外跳转域名被墙

高防服务器高防

国外高防云免备

国外服务器

海外免备案服务器

香港服务器免备案

美国服务器免备案

香港大带宽免备案

香港大带宽

快速注册

如何破解大模型选择困难症？新华网评测：文心一言多项得分高，产业落地规模大

发布时间：2023/8/8

了考验。大模型必须具备行业化、场景化的服务能力，才能满足不同企业的要求。”

文心一言在安全、常识、数学、阅读等方面优势明显

新华网物联网技术总监葛振斌认为，评测大模型有5项维度非常重要：一是把控生成内容安全性的能力，背后涉及意识形态、政治体制、非法涉黄等维度，每一项都事关一个社会文明的底线；二是常识推断计算的能力，涉及自然、文化、地理、历史和生活等多个领域，必须先吃透这些方面的常识，才能避免生成不恰当的内容结果；三是对长文本的语义理解能力。这可以考验大模型产出的内容是否正确且言之有理，是否具有较好的说服力；四是数学运算及数学推理能力；五是主观思维能力，考验大模型是否可以准确理解当地风俗习惯或者传统文化。

新华网评测报告显示，文心一言因中文搜索引擎和算法模型优势，在安全、常识、数学、阅读等方面优势明显。在五个维度上的得分计算均值，文心一言的综合得分为94.7分，排名第一，高于GPT-3.5的76.9分。这说明当前文心一言在总体能力（中文处理）上已经超越了GPT-3.5模型。

新华网测试报告：百度文心一言综合得分第一

凭借上述表现，文心一言在“最适合中国”方面抢占领先身位，领跑国内大模型。

专家：开发者基于文心大模型抢占发展先机

如今，参考权威机构评测成为客户选择大模型的一个重要方式。如同生活中常见的智能手机评测，汽车驾驶评测，是用户选择产品和服务的重要参考。

除了新华网评测报告，近期，还有IDC等多个权威机构发布评测报告，结果均显示由文心大模型3.5支持的文心一言综合能力评测得分超过ChatGPT3.5。比如IDC报告显示，文心大模型3.5拿下12项核心指标的7个满分，综合评分位列国内主流大模型第一，并在算法模型、行业覆盖两大关键指标上拿下唯一满分。

中国传媒大学新媒体研究院院长赵子忠建议，创业者和开发者以及中小企业，其实不需要从0到1的打造自己的大模型，可以基于文心大模型打造智能应用，避免重复造轮子，把精力放在自己擅长的创新上。谁先做出来满足用户需求的应用，谁就抢占了发展先机。

百度2019年推出文心大模型1.0，今年5月份升级到3.5版本。通过飞桨深度学习平台与文心大模型的协同优化，文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

目前百度文心大模型已拥有中国最大的产业落地规模，超过15万家企业申请文心一言内测，其中有超300家生态伙伴在400多个具体场景取得测试成效，覆盖办公提效、知识管理、智能客服、智能营销等领域，联合国家电网、浦发银行、泰康、吉利等企业，联合发布了 11个行业大模型。百度还设立了 10 亿创投基金鼓励大模型创意、繁荣大模型生态。

软通动力CTO刘会福曾表示，我们非常期待在文心大模型的基础上，开拓更多的应用实践。北京宝兰德软件董事长易存道表示，如何把大模型在垂直行业做好，是目前各个企业都要考虑的问题，多数企业无法像百度一样有能力建设大模型。怎么能够把百度的大模型能力和企业业务有效结合起来，创造更强的价值，是企业非常好的弯道超车机会。金山办公助理总裁田然表示，金山办公要跟中国优秀的大模型提供方站在一起。金山办公和文心的合作，会进一步推动大模型在办公领域的应用和快速落地。

“转载请注明出处”

如何破解大模型选择困难症？新华网评测：文心一言多项得分高，产业落地规模大

选择下列产品马上在线沟通：