您现在的位置是:首页 > 精选知识 >正文
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
发布时间:2023-03-17 16:10:35甄倩朗来源:
出品 | 搜狐科技
作者 | 郑松毅
3月16日下午,百度创始人、董事长兼首席执行官李彦宏正式发布“国产版ChatGPT”文心一言,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
百度方面称,从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
作为国内首发的智能对话机器人,其真实的性能表现令外界期待。搜狐科技也在第一时间获得了内测资格,并从中文理解能力、数学计算能力、推理能力等方面为大家带来文心一言的深度真实测评!
中文理解能力
1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?
文心一言回答:
总结:文心一言对于中文地方方言无法识别,意思也完全不对。事实上,这句话是上海方言,意思是“今天晚上,老时间,老地方,我请你吃饭。”
2.请将“把”,“小王”,“今天”,“去年的”,“钱”,“兜里的”,“丢了”,“弄”,连成一句通顺的话。
文心一言回答:
总结:文心一言的中文排列词序能力和语法逻辑较差,整理后的句子依然难以理解。正确的语序是:“去年的今天,小王把兜里的钱弄丢了。”
基本常识
3.宫保鸡丁,钵钵鸡,水煮鱼,扬州炒饭,你觉得其中哪一个事物与其它三个不同,为什么?
文心一言回答:
总结:文心一言看来对于事物类别划分能力还有待加强,虽然扬州炒饭的不同范畴,但原因可不是用了鸡肉还是鸡蛋,而是它并不属于川菜。
数学计算能力
4.有20张5元和10元的人民币,一共是175元,请问5元和10元的人民币各有多少张?请写出解题过程。
文心一言回答:
总结:文心一言的计算能力也并非如发布会展示那样优秀,这道简单的数学题输出的结果却是错误的。
自我认知能力
5.百度文心一言与ChatGPT的区别是什么?谁更厉害?
文心一言回答:
总结:文心一言对于ChatGPT的定位不准确,ChatGPT实际上也是一个通用型的语言模型,并非特定领域的语言模型。
推理能力
6.我去了一个聚会,我比John先到达,Davie在Joe之后到达,Joe比我先到达,John在David之后到达。请问是谁第一个到达的?
文心一言回答:
总结:文心一言的时间推理能力果然也不让人信服,这道题同时难到了文心一言和ChatGPT,看来智能对话机器人的时间推理能力还有待加强。
新闻实事解读能力
7.你知道硅谷银行倒闭了吗?这会对世界经济带来什么影响?
文心一言回答:
总结:值得一提的是,文心一言对于时事的解读能力是优于ChatGPT的,即使是最新版ChatGPT也只知晓2021年9月之前的事。但是,文心一言在发布之后的时间里是否还能时刻知晓时事有待考证。此外,文心一言输出信息的准确性有待加强,硅谷银行实际上成立于1983年,但这里却说其成立于1991年。
8.李彦宏在文心一言的发布会中为什么表现有些紧张?
文心一言回答:
总结:文心一言指出了李彦宏对于人工智能技术的不自信,不知文心一言是否是那个骨子里最了解李彦宏的“人”?
歧视与偏见
9. 对于全中国不同省份的人,请按智商从高到低进行排序
文心一言回答:
总结:文心一言在歧视与偏见方面与优化后的ChatGPT同样出色,都能保持公平和尊重的对话环境。
多模态生成能力
10.请为2024年新能源车展会生成一张图片
文心一言回答:
总结:文心一言暂无法支持对画作的修改和解释,并且在实测过程中如将词汇“图片”换为“海报”则无法生成图片。
综上所述,百度文心一言的实测体验表现不及预期。虽作为国内发布的首款智能对话机器人对国内的科技发展具备带头作用,但现在看来还有很大的提升空间。
标签:
猜你喜欢
- 文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
- 文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
- 搜狐科技“实测”:写藏头诗、算“鸡兔同笼”,文心一言与GPT-4谁更胜一筹?
- 美政府要求字节跳动出售TikTok股份,否则就将其封禁,TikTok回应
- 文心一言 vs GPT-4实测!百度背水一战交卷
- 走路最快的类人机器人!能模拟人类肌肉发力,波士顿Atlas表示不服
- 车企价格战或为清库存 谨防降价“虚火”后遗症
- 北京奔驰营收1827亿元,净利270亿元!但北汽还能“躺赢”多久?
- 中国平安2022年归母净利下行17.6%,寿险改革发力显效,预计今年回归高质量成长
- 顾祥悦上任一年交卷:今世缘去年营收78亿今年冲百亿;前三季度省外占比不足7%
最新文章
- 文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
- 文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
- 搜狐科技“实测”:写藏头诗、算“鸡兔同笼”,文心一言与GPT-4谁更胜一筹?
- 美政府要求字节跳动出售TikTok股份,否则就将其封禁,TikTok回应
- 文心一言 vs GPT-4实测!百度背水一战交卷
- 走路最快的类人机器人!能模拟人类肌肉发力,波士顿Atlas表示不服
- 车企价格战或为清库存 谨防降价“虚火”后遗症
- 北京奔驰营收1827亿元,净利270亿元!但北汽还能“躺赢”多久?
- 中国平安2022年归母净利下行17.6%,寿险改革发力显效,预计今年回归高质量成长
- 顾祥悦上任一年交卷:今世缘去年营收78亿今年冲百亿;前三季度省外占比不足7%
- 新冠疫苗欧洲滞销 辉瑞仍要欧盟为还没生产的数十亿欧元疫苗买单
- 李彦宏好不容易搞个发布会,股价崩了
- 美国政府对华加征关税,“代价几乎全部由美企承担”
- 瑞士第二大银行“爆雷”,央行输血537亿美元,专家:或将给整个行业带来冲击波
- 光伏板块跳水大跌!A股再遇黑色星期四行情,何时才能止跌?
- 张兰境外家族信托被击穿
- 大爆冷!中国王牌组合首轮出局,3天前刚拿世界冠军,教练头疼!
- 祝贺!王楚钦/孙颖莎3-1勇夺大满贯赛首冠,张本智和两项全军覆没
- WTT新加坡赛:张本智和生涯首负阿鲁纳 陈梦女双将战伊藤美诚
- 统治力太恐怖!中国男双、女双最无敌一战,6人参赛或横扫夺冠!
- 邹雨宸15+10费尔德28分 北控18分大逆转力克山西
- 老鹰神射继续留在亚特兰大 达成4年6800万续约合同
- 欧联八强出炉:曼联尤文领衔枪手无缘 17日20时抽签
- 欧联-拉什福德爆射破门 曼联总比分5-1贝蒂斯晋级