关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2747人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄称控制乌居民点 乌称击落米-8直升机

环球网资讯 浏览 2361

李刚仁:很高兴代表巴黎出战100场比赛,希望继续保持状态

懂球帝 浏览 2550

大一新生开学不久在校死亡 家长在医生的建议下报警

红星新闻 浏览 22343

北京独生女被男友殴打致残:他让我再买房写他儿子名字

黄河新闻网吕梁频道 浏览 7545

成龙满嘴谎话?却被兄弟公开指责吝啬人品差?

小娱乐悠悠 浏览 2826

NBA战报:凯尔特人111-107魔术,班凯罗28分

懂球帝 浏览 2406

音乐人袁惟仁去世享年57岁 此前曾摔倒成植物人数年

极目新闻 浏览 7624

俄外长称俄正与北约和欧洲处于“真正的战争”之中

澎湃新闻 浏览 3326

净利润减少超50%,珍酒李渡能靠“大珍”走出低谷吗?

征探财经 浏览 907

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 6105

为什么没什么人争论该买油车还是买电车了

路咖汽车 浏览 972

长安汽车董事长朱华荣:预计到 2030 年,L2 辅助驾驶将成为标配

IT之家 浏览 2792

环球:中国实施稀土出口管制 美方没必要过度反应

环球网资讯 浏览 6243

高市政府迟迟不道歉还发出战争威胁 中方8个字宣告结局

时时有聊 浏览 8028

大动作调仓!机构开年疯狂扫货这些板块,而火爆的芯片、半导体ETF竟被抛售

每经牛眼 浏览 1744

以总理内塔尼亚胡与高级官员讨论伊朗紧张局势

国际在线 浏览 1458

普京:与乌克兰无条件停火不可能

每日经济新闻 浏览 2267

专家:敏感时刻俄核演习展示肌肉 发出强烈威慑信号

澎湃新闻 浏览 2662

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者 浏览 1566

华为诺亚实验室突破:轻量化技术提升AI规划效率

科技行者 浏览 1411

高通遭反垄断调查,国产平替芯片机会来了?

禾颜阅车 浏览 2911
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1