基金财讯

玩海龟汤、弹钢琴、怼亲戚,大语言模型不想干的我们都测了一遍

比起各种大模型 BenchMark,不如来比比生活中真正会遇到的离谱问题。最近测试了多个新发布的大语言模型,通过一些趣味活动如海龟汤推理游戏、钢琴演奏和回应亲戚的视频观点,来评测这些模型的推理和应用能力。

下载专栏报道 APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动

#玩海龟汤弹钢琴怼亲戚大语言模型不想干的我们都测了一遍

推荐阅读

套现近 1000 亿,马云从阿里股东名单中消失,他还剩下多少股份?

admin

今年来公募参与定增总额缩减 607 亿,下滑七成,目前已是赚多亏少,局面反转

admin

「有毒」 的短剧行业,仍是一场流量游戏

admin