如今,前沿的人工智能技术已经运用在奥运会上,背后的推动力就是中国的科技实力。
就在巴黎奥运会比赛日正式开始,逐渐点燃观众激情的同时,一部名为《奥运8分钟》的短片也引发关注。
不仅国际奥委会主席巴赫力推:“得益于中国的AI技术,这些女性在体育方面取得的成就被赋予了新的色彩。”
网友们也纷纷点赞:
人工智能技术以现代的清晰度重现历史时刻。
该短片名为《致敬她的伟大》,由阿里巴巴与国际奥委会联合推出。
百年奥运史上伟大女性的影响力故事,在此浓缩为珍贵的8分钟,旨在向奥运赛场上不断从0到1、不断突破、奋斗的一代又一代女性运动员致敬。
值得注意的是,这部8分钟的短片不仅利用AI为历史瞬间重新着色,还运用了大模型和AIGC技术。
她永远不会失去光彩
很多朋友可能注意到了,奥运会时隔100年再次在巴黎举办,一个明显的变化就是,100年前,参加奥运会项目的女运动员寥寥无几,但2024年巴黎奥运会,男女运动员比例首次达到1:1。
另一个显著的变化是,这也是第一届广泛应用人工智能技术的奥运会。
△阿里云AI增强视频
阿里云与国际奥委会携手,利用第二次变革带来的技术变革,向公众展示更多推动第一次变革的女运动员历史上的珍贵瞬间。
以苏珊娜·朗格伦 (Suzanne Lenglen) 为例,她是有史以来最伟大的女子网球运动员之一。
自1921年到1926年,苏珊娜·朗格伦曾五年蝉联世界第一。
苏珊除了在赛场上有着令人印象深刻的表现之外,她还是打破女子网球运动服饰保守规定的第一人。
长袖改成短袖,长裙改成及膝百褶裙,网球裙重量由18公斤减轻到0.18公斤。
可以说,从她开始,女子网球运动员才得以摆脱服装的束缚,在赛场上充分发挥自己的才华。
再比如,首位奥运会女子混合团体飞碟冠军张山。
1992 年之前,女子双向飞碟射击并非奥运会正式比赛项目。双向飞碟射击是一项男女混合项目,这意味着女性运动员可以参加男子比赛。
在张山之前,该项目的冠军一直是男性,但1992年的张山改变了这一切。
预赛中,张山以150个命中的成绩成功进入半决赛;随后,他在半决赛中以200发200个命中的成绩平了世界纪录,进入决赛。
决赛中,张山独自面对五位男选手的挑战,最终她获得了比赛的胜利,同时也赢得了全场观众的尊重和欢呼。
颁奖仪式上,银牌、铜牌得主将张山高高举起,另一位中国射击名宿许海峰也拍下了一张经典合影。
还有第一位正式参加波士顿马拉松比赛的女性,凯瑟琳·斯威策 (Kathrine Switzer)。
1967年,19岁的凯瑟琳“不顾一切”,隐瞒性别报名参加波士顿马拉松。当时,马拉松被认为是一项“不适合女性”的运动。甚至在凯瑟琳比赛期间,主办方的工作人员突然出现,试图撕掉她的号码牌,并对她大喊:“滚出赛道。”
即使在她完成比赛之后,组委会仍拒绝承认她已完成比赛,并指责她扰乱比赛秩序。
“你想证明什么?”
这是当时记者向凯瑟琳提出的问题。
60年后,叶卡捷琳娜本人在巴黎的这8分钟里给出了答案:
不仅仅是我,每个女人都有权利做自己想做的事。
这是电影《她永不褪色》中的三位主角,为了更加鲜活真实地还原她们的历史瞬间,阿里云利用AI修复技术,对老照片、视频进行上色,并基于生成式技术完成。
该项目主要包括三个主要加工步骤。
涉及的具体技术方案包括图像彩色化、基于生成对抗网络和卷积神经网络的图像去噪与超分辨率、以及可控图像生成技术。
《她》背后的AI技术
修复老照片、老视频听起来似乎不是什么新鲜事,但事实上,当修复的对象变成运动的影像时,背后的技术难度就大大增加了。
例如,苏珊娜·伦德格伦 (Suzanne Lundgren) 的这张照片拍摄于 100 多年前,如下所示:
首先,面孔不再清晰。
另一方面,背景观众的数量也增加了修复的复杂性。
阿里云修复团队想到的解决方案是,利用大模型+Stable Diffusion等生成式AI技术,加入文字引导,让AI发挥想象力,同时控制这种想象力,让它不偏离历史本身。
具体来说,技术人员首先利用扩散技术对人物脸部进行重绘,在重绘过程中,为了保留原始人物信息,会结合真实的历史信息作为参考,并使用ControlNet等技术对人物脸部的线条、深度进行控制。
对于背景复杂,因透视原因本来就模糊的照片,修复团队重点针对照片中的关键人物和元素进行修复,仅修复背景的一小块区域,最后再将前景与背景拼接在一起。
为了让色彩更加自然,阿里云修复团队还结合历史学家的专业意见,通过对历史色彩库的学习,让AI着色准确率达到80%以上。
此外,在超分辨率方面,阿里云的技术方案可以在1秒内将640p分辨率图像超分辨率到4k分辨率,清晰度提升25倍。
在视频修复方面,阿里云修复团队重点解决了视频一致性、连续性的问题。
例如,在恢复跑步视频时,如果只是逐帧着色,算法可能会在某一时刻将运动员的裤子涂成红色,而在另一时刻涂成黑色。
修复团队对此进行了专项优化,包括对视频进行细致的分割,并将每个片段的色彩效果和清晰度调整到最佳。
运动图像的另一个特点是变化非常快,针对这一问题,阿里云修复团队利用生成技术,对老视频进行插帧,以实现更好的连续性。
事实上,由于修复难度较大,我们最终看到的8分钟《包青天》影片是经过多轮反复修改后呈现的。
在这个过程中,修复团队耐心地一遍又一遍研究照片,甚至“已经分不清哪一张更像真人”。最核心的原因是,在修复过程中,技术人员本身也受到了女运动员们的启发:
我们希望通过修复这组照片,让更多的人了解这些历史上的重要事件,也希望通过修复技术,让像凯瑟琳女士这样打破壁垒、提高竞技水准的女性精神激励更多的人。
这也是尖端科技对于历史文化遗产的价值:
人工智能可以让生活在今天的人们更加直观、真实地感受到埋藏在时间长河中的历史印记,科技的力量在人类人文精神的延续与守护中发挥着越来越重要的作用。
评论(0)