关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1673人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

33岁超模孕期做高难度瑜伽,挺大肚四肢水肿

盖饭娱乐官方号 浏览 19504

东方空间引力一号国内首次完成火箭垂直状态远距离海上运输试验

IT之家 浏览 11184

最好看的羽绒服,都满足这几点

Yuki女人故事 浏览 201

高通遭反垄断调查,国产平替芯片机会来了?

禾颜阅车 浏览 1044

智界S7交付困难,另有隐情?不是产能不足,而是有人“使绊子”?

小李车评李建红 浏览 12550

刚担任欧盟轮值主席国 比利时首相一开年就选择访华

上观新闻 浏览 75936

男子租房交万元后才发现地板是烂的 想退租要扣近6千

都市快报橙柿互动 浏览 70089

电影《集结号》筹备的时候,冯小刚刚开始是拒绝张涵予演谷子地

趣看热点 浏览 26533

陈小春在沈阳开演唱会,被东北观众感动到流泪

小娱乐悠悠 浏览 371

环球时报:149亿美元收购案遇阻,日本应反思

环球时报国际 浏览 12721

秦煌如今过成这样只能算他活该?

一针见娱 浏览 1035

18岁男青年被控猥亵5岁女童获刑5年半 家属:证据不足

红星新闻 浏览 96267

中年女人穿衣别太花哨!早春掌握好这些简约穿搭,高级显气质

静儿时尚达人 浏览 12552

纳瓦罗收获个人中网首胜

体坛周报 浏览 1499

"1999年小朋友捐140元给国家造航母"热传 当事人发声

都市快报橙柿互动 浏览 5006

这四件外套,承包冬天90%的时髦

Yuki女人故事 浏览 13476

土耳其对内塔尼亚胡等人发出逮捕令 以色列回应

环球网资讯 浏览 652

中国历史上最强大的朝代,哪个你觉得最强大?

趣看热点 浏览 25925

海港0-2町田,傅欢乌龙,海港全场1射正,相马勇纪破门

懂球帝 浏览 917

芬奇谈输球:我认为大家获得了一些不错的机会 但可能打得着急了

直播吧 浏览 12500

斯坦福MLE-Smith:自动生成机器学习竞赛题目

科技行者 浏览 659
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1