关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者883人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

科技氛围浓郁 全新奥迪Q5L内饰正式公布

车质网 浏览 336

新外号?网友:哼导也是第一次进主场吧? 刘维伟:是的

直播吧 浏览 19035

AI浪潮已至,重磅嘉宾云集,乌镇再启新汽车之问

AutoBusiness 浏览 613

又见清仓式卸任,“1124新规”为什么挡不住基金经理离职?

界面新闻 浏览 13087

苹果发完M5芯片,最开心的是M1钉子户

机器之心Pro 浏览 963

波利塔诺:我们应铭记输给埃因霍温,提醒自己要一直全力以赴

懂球帝 浏览 687

神预测,热乎乎的最新诺奖得主电影神作来了

幕味儿 浏览 996

ST路通内斗激化!“资本大佬”吴世春“抄底”遭遇绊脚石

野马财经 浏览 805

东京奥运会如空场日本将损失1450亿,成史上最亏奥运会

趣看热点 浏览 567973

CIA局长:俄罗斯人对战争不满 现在是招募间谍良机

环球网资讯 浏览 15560

嫦娥五号成功落月,发回第一张高清月面照片

趣看热点 浏览 25405

特朗普被控37项罪名 起诉书启封后2名律师辞职了

直新闻 浏览 89798

内地客疯抢香港住宅,香港人反向抄底深圳写字楼,哪个租金回报更高?

华夏时报 浏览 12508

不止造车 奥迪在北京做了一件关乎自然未来的事

网易汽车 浏览 962

人社部就业促进司:我国人口红利没有消失

新华社 浏览 16119

周也你怎么两副面孔?

伊周潮流 浏览 11711

限制赎回风波后,当红PE Blue Owl为数据中心专项基金募资17亿美元

华尔街见闻官方 浏览 148

普京就“瓦格纳事件”发表讲话 绍伊古在场

界面新闻 浏览 111361

马罗塔:国米不考虑中途换帅

体坛周报 浏览 1426

时尚芭莎删除那艺娜物料,网友称其被“退货”

韩小娱 浏览 874

新款现代Creta预告图发布,将于1月16日印度上市

天天汽车 浏览 12527
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1