普通人也能用AI拍出3D大片?这位清华博士后这么做
从《阿凡达》到《流浪地球》,从好莱坞科幻 3D 电影之最到中国科幻 3D 电影之最,从 2009 年到 2019 年,近十年的岁月,见证了中国 3D 影视制作的快速成长和繁盛,也刺激着赵天奇探索人工智能与影视制作结合应用的信心。
影视制作中,科幻电影的火爆让全球影迷感受到了 3D 特效的魅力,这与近年来人工智能技术的突破性进展密不可分。
“比如《流浪地球》的每一个镜头都需要手工制作,这个过程十分复杂,耗费的人力成本也非常之高。人工智能影视制作就是用 AI 替代影视行业中大量的比较枯燥、高成本、低创造性的工作。”聚力维度创始人、CTO、Qualcomm AI 荣誉技术大使 赵天奇如是说。
多年来,赵天奇一直专注人工智能与影视行业的结合创新。北邮读博期间,他创立了一家名为十二维度的公司,定位于数字图像及 AI 在 3D 影视方面的应用,当时,VR 市场的火爆让 3D 找到了最佳落地方向,但他并不满足,在赵天奇的带领下,2016 年,科幻成真实验室首个人工智能 2D 转 3D 平台 “峥嵘” 上线,而他现在还是清华大学人工智能影视方向的博士后。
自动实现 2D 转 3D 有何难?
2011 年开始,随着谷歌、微软研究团队先后将深度学习应用到语音识别领域,2019 图灵奖获得者 Geoffrey Hinton 团队在 ImageNet 大赛中利用深度学习将图片识别的错误率大幅降低,由深度学习技术推动的人工智能开始得到更多科研机构、工业界的高度关注。
尽管那时人工智能的概念还没有如今这么火爆,但赵天奇敏锐地察觉到深度学习背景下语音识别、计算机视觉在影视行业所变革的潜力。
传统的 3D 内容制作技术主要有两种:一种是 3D 双机实拍,一种就是 2D 后期转 3D,但仍需要耗费巨大的资金、人力和时间成本。而技术的瓶颈直接导致 3D 内容的匮乏,目前国产 3D 电影呈扎堆之势,但成熟者却不多。那么,将 2D 视频渲染成 3D 有哪些技术难点?
赵天奇强调,一是影视内容的类别十分复杂,例如人物场景、自然场景、历史场景、想象场景等,每增加一个维度就上升一个级别;二是对观影效果的要求非常高,将丝毫的抖动误差排除到最小。为此,他们针对性地设计了多级神经网络、时空复用信息、对抗神经网络等技术,最终达到了院线级的水平。
很多算法是 “玩具级”的,只能用来娱乐
目前,聚力维度在 3D 领域的产业化已经非常成熟了,包括院线电影、电视剧、视频直播等 ToB 领域,以及涉及个人短视频、2D 转 3D 的 ToC 领域。
谈及此前争议颇多的 “AI 换脸” 技术,在赵天奇看来,“有很多算法都是‘玩具级’的,娱乐可以,但没有人用它来生产内容。”
他认为,如果将人工智能的应用分为识别、决策、生成、理解几种任务的话,聚力维度是一家专注于影视产品生成的公司。怎么理解呢?“就是给人去看、去听,而不是帮人决策。”
聚力维度还联合 Qualcomm 共同为终端用户提供语音技术服务。赵天奇认为,Qualcomm 本身在移动端的基因非常深厚,也是非常符合场景需求的,对于 AI 技术快速落地到移动端,也是最有发言权的。
当然,这只是一个起点,未来在 ToC 领域像变脸、面部捕捉、动作捕捉、3D 转换等(技术)双方都可以进行更全方位的合作。而且,赵天奇团队也在积极探索真人级的面部捕捉、动作捕捉技术,计划与电视台等合作落地“虚拟主播” 项目。
不久前,赵天奇被评为 Qualcomm AI 荣誉技术大使,这无疑是对其团队的一种肯定。赵天奇强调:“我们做这个方向在 AI 领域确实也是一个比较独特的方向,相对于大热的安防人脸识别、自动驾驶决策等领域,影视生成并不是所有人都能理解的。但我们也发现:不管是影视传媒还是互联网领域的合作伙伴,都可以与之合作加速 AI 影视制作的落地。”
“人人都可以做影视作品”,是赵天奇对当下 AI 在影视行业产生变革的愿景。例如,定制化电影、时效性电影、多结局交互游戏式电影都是他们正尝试突破的方向。未来,赵天奇还希望利用 AI 技术将面部捕捉、声音捕捉、动作捕捉、动作生成全流程覆盖,真正实现“视频作家”,并将全流程服务在产业中快速落地。
专用人工智能是没有泡沫的
据英国风投基金 MMCVentures 发布的最新研究报告显示,欧洲 2830 家标榜为 AI 的公司中,有 1580 家符合 AI 公司的定义,也就是说,近四成的公司其实和 AI 没有任何关系。当时,这一数字的公布,引起了圈内不小的震动。
“从现阶段来讲,如果大家对通用人工智能 / 强人工智能有所期待的话,这件事情应该是有泡沫的;相反,专用人工智能,从本质上是没有泡沫的。”赵天奇认为。
他还建议:专注于高校里的研究人员,更适合研究通用人工智能,因为企业拥有数据,在盈利压力之下,可能会在某个专项问题上比高校内的研究人员取得更为突出的成果;但同样企业需要盈利,就无法专门去研究通用人工智能,所以新的技术就可能出现在纯研究人员的高校群体中,“尽量往需要小数据,不需要数据,通用人工智能这条路上去研究;如果是创业者,一定要针对他自己熟悉的领域以及对应的专用人工智能结合,彻底地分析这件事情的可行性、局限性。”
当然,AI 算法只是意味着开了个好头,真正考验的是创新企业如何结合自身业务将算法进行商业落地。要知道,AI 的实际技术门槛很高,在发展过程中,真正的 AI 公司也可能遇到数据和技术的挑战。在这一点上,对于持续高涨的中国 AI 企业来讲更是挑战巨大。
“对技术与行业时刻保持深刻理解,一定要两者结合才能形成真正落地的项目。”对于赵天奇而言,从最初 2012 年创立团队,经历了 2016 年颠覆创新,现在已经能准确把握人工智能与影视行业结合的痛点,让人人都能做电影,科幻般的人工智能影视制作方式成为现实。
特别提示:
Qualcomm 荣誉技术大使所发表的内容及观点均属原作者个人意见,并不必然代表 Qualcomm 或其分支机构的立场。这些内容仅供信息参考,并非获得 Qualcomm 或其他任何一方的认可或代表其观点。
相关文章:

[asp.net core]SignalR一个例子
摘要 在一个后台管理的页面想实时监控一些操作的数据,想到用signalR。 一个例子 asp.net coresignalR 使用Nuget安装包:Microsoft.AspNetCore.SignalR 在StartUp中启用signalR // This method gets called by the runtime. Use this method to add serv…

【FFmpeg】截至ffmpeg4.2不推荐(Deprecate)继续使用的接口,以及代替它的接口汇总
1、问题描述 使用ffmpeg库写程序,编译时,经常报警告“xxx is deprecated” 查看源码时,该接口或结构体字段被标记attribute_deprecated,表示它已经过时,不推荐使用。 如: attribute_deprecated void avcodec_register(AVCodec *codec);attribute_deprecated void avcod…

Asp.net开发过程中,我们会遇到很多Exception
在Asp.net开发过程中,我们会遇到很多Exception,不处理这些Exception的话会出现很难看的页面。还有一些我们未预料到的Exception,当发生Exception时,我们也必须进行记录具体位置,以便我们修正错误。asp.net异常处理的位…

【经验】对一个合格C++高级工程师(音视频方向)的要求
1、C高级工程师 经过查看招聘网站上对“C高级工程师”这个职位的招聘要求,只总结了技术、能力要求,不涉及工作年限、学历 具体要求如下: 精通C面向对象程序设计; 熟悉设计模式; 敏捷开发经验; 扎实数据结…

马云:腾讯不是阿里要打败的对手,是同为社会创造价值的伴侣
整理 | 琥珀出品 | AI科技大本营(ID:rgznai100)近日,在甘肃敦煌举办的 2019 年中国绿公司年会上,阿里巴巴创始人、董事局主席马云谈及企业间的竞争时,提到了与腾讯的关系。他表示,没有腾讯,阿里…

Win10 | Mac 在server上统一办公
一个非常实际的问题,通常我们主要有三个工作的地点:1,server,用于大型数据的分析和处理;2,办公室的电脑,正式办公;3.自己的电脑,偶尔加班。 不同的工作平台之间很难同步&…

JDK5.0新特性系列---目录
JDK5.0新特性系列---目录 JDK5.0新特性系列---1.自动装箱和拆箱 JDK5.0新特性系列---2.新的for循环 JDK5.0新特性系列---3.枚举类型 JDK5.0新特性系列---4.静态导入 JDK5.0新特性系列---5.可变长参数Varargs JDK5.0新特性系列---6.格式化输出 JDK5.0新特性系列---7.使用Proce…

怎样搞定分类表格数据?有人用TF2.0构建了一套神经网络 | 技术头条
作者 | 王树义来源 | 玉树芝兰(ID:nkwangshuyi)以客户流失数据为例,看 Tensorflow 2.0 版本如何帮助我们快速构建表格(结构化)数据的神经网络分类模型。变化表格数据,你应该并不陌生。毕竟&…

【FFmpeg】Hello World!尝试如何编译FFmpeg程序
1、说明 下面的例子只演示,编译FFmpeg时用的头文件和库,不涉及编解码,只调用一个可以打印编译FFmpeg库的配置项的接口:avcodec_configuration() 2、avCfg.c #include <stdio.h> #include <libavcodec/avcodec.h>int main(int argc,char *argv[]

x-pack watch邮件报警配置
参考网址: https://www.cnblogs.com/reboot51/p/8328720.html https://www.elastic.co/guide/en/x-pack/5.6/actions-email.html #邮件设置 elasticsearch 配置 xpack.notification.email.account:exchange_account:profile: outlookemail_defaults:from: infomail.…

虚拟桌面的备份恢复最佳实践 第一部分
摘要 VMware View 是目前虚拟桌面市场的旗舰产品。借助它,企业可以将办公系统、应用和基础架构以高性能、高度可扩展的集中式托管服务形式交付给用户。View 还可提供保护它所支持的系统和应用以及相关用户数据所需的功能。它支持方便地备份和还原存档数据。 通常&…

Python程序员Debug利器,和Print说再见 | 技术头条
整理 | Rachel责编 | Jane出品 | Python大本营(id:pythonnews)【导语】程序员每日都在和 debug 相伴。新手程序员需要学习的 debug 手段复杂多样,设置断点、查看变量值……一些网站还专门针对debug撰写了新手教程。老司机们在大型…

【FFmpeg】解决警告warning: xxx is deprecated [-Wdeprecated-declarations]的方法
1、问题描述 编译FFmpeg程序时,经常报一些关于“deprecated”的警告信息,具体内容如下: decode.cpp:28:2: warning: ‘void av_register_all()’ is deprecated [-Wdeprecated-declarations]av_register_all(); decode.<

[BZOJ2527]Meteors
整体二分挺好玩的...学一发 这个询问显然是可以二分的,但每次都二分就会T爆,所以我们有了“整体”二分 每次处理一些询问,要求这些询问的答案一定在$[l,r]$中 先把$l$到$mid$的操作实施,那么当前TAK的询问答案一定在$[l,mid]$中&a…

一个可提供html5制作服务的网站
2019独角兽企业重金招聘Python工程师标准>>> 【TechWeb报道】最近网上出现了一个专门基于HTML5/CSS3制作服务的组织 P2H.cn. 就是专门提供网站切图的一项服务。特别在哪儿呢 ,P2H.cn 可以制作出完美的兼容的html5/css3的页面。 王大利/文 如果你不知…

【Ubuntu】Ubuntu下的录频软件SimpleScreenRecorder
1、说明 官网介绍:https://www.maartenbaert.be/simplescreenrecorder/ 源码参见github:https://github.com/MaartenBaert/ssr 2、安装 Ubuntu版本>17.04,直接安装 sudo apt-get install simplescreenrecorderUbuntu版本<17.04&…

打开阿兹海默之门:华裔张复伦利用RNN成功解码脑电波,合成语音 | Nature
作者 | 琥珀出品 | AI科技大本营(ID:rgznai100)2019 年 4 月 24 日,来自加州大学旧金山分校(UCSF)神经外科学系 Gopala K. Anumanchipalli,Josh Chartier,Edward F. Chang 团队在 Nature 杂志上…

[转载] 别人的心得感悟
原文: https://www.cnblogs.com/double-K/p/6926367.html#commentform ---------------------------------------- 不可说的感悟-——十年老技术转型(一) 佛曰:“不可说,说既是错”,所以本篇也是错…

Windows Phone 7、XNA的旋转的背景
在游戏表现的过程中需要一些比较酷的动作,我们需要通过图型与XNA中的一些代码来实现,比如我们要说到的一个360度转动的圆。 在手机上的效果如下: 当然在这里我们看不到转动的效果,下边提供的有源码,大家可以下载运行测试一下。 操…

【Qt】报错error: undefined reference to `vtable for的解决方法
1、问题描述 编译Qt程序时,在某个类构造函数定义处报错: error: undefined reference to vtable for2、原因分析 导致错误信息的原因是:子类没有实现父类的纯虚函数; 在Qt中,首先要想到的是在一个类中添加了新的继承…

110万开发者的福音,百度Easy DL商品检测专业版上线
继首场百度大脑开放日上一口气开放24项全新AI技术后,4 月 25 日下午,第二期百度大脑开放日如约举行,本次共发布了13款AI通用新能力、5项技术升级,并推出了EasyDL商品检测专业版和语音识别自训练平台两大全新的可定制训练平台。 实…

简单爬虫学习记录
实现思路解析:爬虫调度器:启动/停止爬虫,规定爬虫的范围;URL管理器:管理2个URL:新的没有爬过的urls;旧的爬过的urls;URL下载器:下载url对应的html数据;HTML解…

开启笔记本win7的虚拟热点,让你的本本变成wifi
写在前面:相信很多人都跟我一样有困扰,在学校用校园网不能wifi,所以在此提供一个教程,希望能给机友们一些帮助。帖子转自网络,自己也测试过了。分享给大家,希望能给大家带来一些方便。开启windows 7的隐藏功…

检测到包降级: Microsoft.Extensions.Configuration.Abstractions 从 2.1.1 降 2.1.0
解决方法:工具-nuget管理包-程序管理控制台-选择 项目- 执行 -Install-Package Microsoft.Extensions.Configuration.Abstractions -Version 2.1.1命令即可。 转载于:https://www.cnblogs.com/dashanboke/p/9229826.html

【FFmpeg】如何通过url的格式找到对应的协议,以rtmp为例
1、简述 在使用 avio_open 接口时,只要给形参 filename 传入 url 格式的字符串就能找到对应的协议。这篇博客就是追踪 avio_open 的调用关系,探明如何根据一个url字符串就能找到对应的协议。下面以rtmp协议为例。 2、FFmpeg对rtmp协议的支持 rtmp协议的实现源码在 libavfo…

李开复口中的“联邦学习” 到底是什么?| 技术头条
近日,在百大人物峰会上,创新工场创始人李开复谈及数据隐私保护和监管问题时,表示:“人们不应该只将人工智能带来的隐私问题视为一个监管问题,可尝试用‘以子之矛攻己之盾’——用更好的技术解决技术带来的挑战…

业务逻辑应该在哪里实现更为合理呢?
请大牛们讨论下业务逻辑应该在哪实现较为合理 1、java业务逻辑层。 2、后台存储过程。 因为本人一直都在业务逻辑层实现。但新项目中领导要求将业务写到后台存储过程,java业务逻辑层不承载业务逻辑的实现功能。 先说本人的观点: 本人偏向写在java业务逻辑…

前端不哭!最新优化性能经验分享来啦 | 技术头条
作者 | Dimitris Kiriakakis译者 | 风车云马编辑 | Jane出品 | Python大本营(id:pythonnews)【导语】Angular、React、VueJS 是现在一些主流的 JS 框架,那它们在构建网站或前端程序时,是如何保证性能,减少大…

【FFmpeg】如何通过字符串到对应的封装器,以flv为例
1、简述 使用avformat_alloc_output_context2创建封装器上下文AVFormatContext时,只需将封装器的名字传递给形参format_name,就可以获取对应的封装器。这篇博客就是追寻avformat_alloc_output_context2的调用关系,探明原因。 函数原型如下: int avformat_alloc_output_co…

坚持使用Override 注解(36)
2019独角兽企业重金招聘Python工程师标准>>> 1、覆盖超类时千万小心,一不小心就变成重载了 2、现代的IDE 会在覆盖父类方法而没有使用Override 时给出一个警告 在具体类中不必标注你确信覆盖了的抽象方法声明的方法(虽然这样做没什么不好&…