关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者1727人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这一天,35岁李沁秒了28岁陈哲远,才知李少红当年的眼光有多绝

温柔娱公子 浏览 2836

香港65公斤黄金被劫价值超半亿 西九龙重案组深夜通报

极目新闻 浏览 15068

库克直播间带货 苹果换了打法

北京商报 浏览 2985

卡罗拉锐放价格再下探!网友:这次真心动了

汽车网评 浏览 1650

万科三季度净利润亏损160.69亿,深铁今年第十次“输血”

财视传播 浏览 2617

大普微浸没式液冷版蛟容5企业级固态硬盘实现正式应用落地

IT之家 浏览 2145

纳斯达克称申请将工作日交易时长延长至23小时

财联社 浏览 2018

阿里达摩院推出电商智能体全面测试基准

科技行者 浏览 1774

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 2635

为何美军害怕伊朗布设水雷

澎湃新闻 浏览 538

售14.98万 方程豹钛3推501km后驱Ultra版

网易汽车 浏览 2619

孙俪、罗晋53集都市职场剧,阵容强大,值得一看

楠鱼 浏览 3500

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 2662

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

静儿时尚达人 浏览 1750

科技巨头疯狂投资AI基建,芯片厂商吞了云服务企业的利润?

澎湃新闻 浏览 2826

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 1765

天空:联赛杯新规出台,塞门约可出战纽卡斯尔

懂球帝 浏览 1726

约翰霍普金斯大学:让卫星"慧眼"像人类一样逐步发现地面变化

科技行者 浏览 1653

以军已停止在加沙地带军事行动

财联社 浏览 2655

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 2607

媒体:特朗普提出中美"G2"概念 日本不安拼命找存在感

澎湃新闻 浏览 30255
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1