有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。

USC 大学教授、Pinscreen CEO Hao Li 是否存在论文造假、产品虚假宣传等问题?

关注者
1,490
被浏览
463,480

49 个回答

匿名用户
匿名用户
有答案建议我们要充分发挥实践精神,所以我这里实践一下。
我还是选一些比较常见的例子,这里用的是iOS的Pinscreen 2.0.1版。左边是输入,右边是输出。为了表示公平,这里选用的都是没有遮挡,没有强光,表情不夸张的例子。
比如,
  1. 迅爷。这张其实是我试的比较好的结果。
2. 至于这个我就不知道该怎么评价了。
3. 这个真的。。。不太行。尤其当原图额头露出的较多时候,头发和额头之间连接似乎很容易有问题。而且比较散乱的发梢完全丢了。
4. 菲爷表示这是什么鬼。
5. 石原这张发型还是不像。
讲道理,这种结果不够上SIGGRAPH。而且这个是已经产品化以后的。你跟我说SIGGRAPH时间紧你没功夫polish所以质量有限这个大家可以理解,但是现在距SIGGRAPH ASIA 2017已经一年了,产品里的结果依然很糟糕,这个真心没法洗。
======================
评论区有同学建议使用欧美人群试一下。
  1. 艾玛沃森,这个脸型比亚裔匹配的好很多,至少看右边的可以会想到,这个长得有点像艾玛沃森。但是发型依然不太对。
2. 龙妈,脸还是不太对,而且发型比较奇怪。
3. 不得不说欧美人脸型的匹配确实好很多,但是头发稍微长一些就捕获不到了。
4. 稍微偏一点就会出问题,头发对脸有遮挡也处理不太好。另外长发过了肩的部分还是丢了。
5. 这个算是脸型捕捉的最好的了。发型上面一部分大体是对的,但是发梢还是没有捕捉到。
下面提高一点难度,试一下非裔。
6. 非裔常见的卷发完全捕捉不到了,估计算法是没有考虑这方面的问题。
7. 卷发比较多的时候,算法完全无能为力。而且头发裁剪也不干净,跑到脸的纹理上去了。只能匹配大致色块形状。
8. 脸型匹配的确实还不错。对于人工处理过的发束还是无能为力,估计算法没有考虑这些情况。

结论:亚裔人群估计是先验不对的问题,脸型普遍匹配很奇怪。欧美人士在这方面结果好很多。头发的话,稍微长一些普遍会出问题,非裔常见的卷发、多发束的情况估计完全没有考虑或者不在训练数据里。
=================================
有一个关键问题就是这个App生成的长发普遍不能过肩。我实在是很好奇为什么。因为Real Time Live时候他们是展示了能做长发过肩的,就是下面这张。
好的,那么我们不如试试把左边这个作为输入进App,看一下目前做这个是不是更好了,以及长发到底能不能过肩。
输出是右边这样的,首先这个和RTL时候有显著差别。当然,可能是因为改进了,不过为什么把长发过肩的特性改没了呢?我们注意到有这样一个Skype截图,这里面说,应该加一些hair cutting从而防止人们重现。。。emm,不知道是不是有这么回事。
所以,要么是长发过肩做不了,RTL的结果有问题;要么就是后面做了hair cutting。所以到底是哪个呢?
=================================
有同学说还是要用论文里的才更能说明问题,那好咱们试一下论文里的。
论文里面第十页给了这么个例子。
我们就用最左边的头像作为输入,得到的结果是这样的:
所以,有同学说移动端为了性能,去掉了一些算法,那这个移动端的是减少了多少算法,导致差异这么大呢?
而且有同学又说,艺术家手动建模说的是准备数据库,那减少的算法是如何影响在这个数据库里搜索呢?
=================================
另外,说两句跟吃瓜群众相关的。Iman对黎灏的控诉书里,120多页的地方有这么个记录:
Hao是这篇文章的审稿人之一,在审稿期间(SIGGRAPH 2017是1月18日截稿,3月6日出审稿结果,这个截图里是2月4日)把文章分享给外人,这是很严重的违规。
而Iman发过的所有文章都是做渲染的,熟悉SIGGRAPH审稿的人都知道,做渲染的Iman根本没可能接触到做发型分类的文章的审稿,如果不是被分享了,他永远不会知道SIGGRAPH上有人投过这么一篇文章,所以这个是洗不干净的。
这篇在SIGGRAPH投稿编号为523的文章标题是(链接到PDF):
可以看到后来被SIGGRAPH的审稿人杀掉以后,作者又投了一个叫SMC的会议并被收录。
在这里提醒吃瓜群众们,如果你的文章被杀掉了,赶紧找个小一点的会议/期刊投掉,不然碰到这种审稿人,被scoop了都不知道是怎么死的。
===================================
最最后,说交给法庭的起诉书里,Skype截图有可能是PS的不能作为证据的各位,你们真的不知道取证调查员(forensic investigator)是干什么的么?不知道微软在有搜查令的情况下是可以提供服务器上所有Skype谈话记录么?
匿名用户
匿名用户
下一个Elizabeth Holmes,诈骗岛尽出人才。
Sadeghi都告到加利福尼亚州的高级法院了,你当法官是傻子啊,PS对话图不看源消息的?我真的都懒得吐槽一些答案,在诉讼案里面提交PS对话内容,黑的太弱智。而且我今天看了Sadeghi的诉讼案,他也确实没有必要骗人。
Sadeghi本来工作干得好好的,之前曾经在迪士尼工作室工作,期间为Tangled开发了新的毛发渲染框架,后来又跑到ILM工作,最后在谷歌当软件工程师,这些工作放到哪个CG从业人员身上还不得笑死,国内很多学Computer Graphics的学生一开始也不可能有这么高的高度。
Sadeghi被Hao Li欺骗拉到pinscreen,Li跟他说Pinscreen已经能自动生成身体和毛发,但很显然是在欺骗对方。
Sadehi问Li能否自动生成毛发,Li欺骗说可以
七骗八骗把Sadeghi骗进公司,又不把他当人看,带侮辱性地让他把两个月的工作在一个月做完,然后嘲讽的加了一句“We have the best hair rendering guy”。这是个十四个人的工作群,Li说了“pulled his shit off in 1 month”妈的,看得我气死了。
然后又经历了一系列垃圾事情,包括打人、造假、违约等等,诉讼案里都有记录。他是Pinscreen的员工,起诉公司对他又有什么好处?
对了,他的学生不是在知乎嘴硬说没有造假吗?SIGGRAPH 2017的demo直接能把脸打肿。前一张是他们演示的demo,这里的Pinscreen自动生成的面部识别和毛发的精度非常高,后面是知乎用户的实际体验。造假这么明显,良心不会痛吗?有兴趣的这是视频链接https://youtu.be/hpuEdXn_M0Q

对了,软银的钱骗得爽吗?重点品品这两句话
软银投资后,Pinscreen估值一亿美元,我真是呵呵,和Theranos公司一个路子
知乎用户
知乎用户
迪丽热渣
只有图片证据的话,两边都别站,因为都是能中siggraph的人,伪造图片的技能树应该都点满了。

说伪造图片什么的,有点哗众取宠了。案子交给“Superior Court of the State of California”,在起诉书里放ps过的聊天记录,不是一个理智正常的人能做得出的事。Perjury是重罪,坐实了会坐牢的。聊天记录很可能是在第三方的服务器上,所以法庭可以验证。为了一个民事案子交伪证,根本不值得。
看了下原文,不可谓不精彩,这里摘取一些重点简述一下:
作者Iman Sadeghi是UCSD PhD毕业,在一次学术会议上认识了Hao Li, Li希望Iman加入他的创业公司Pinscreen并愿意授予VP of Engineering的职位,邮件为证


在邀请Iman加盟的过程中,Li展示了几个产品的demo,并表示是算法全自动生成的,Iman在后来高度怀疑这些结果是人工生成而非算法自动生成。


在Iman加入Pinscreen后,Iman逐渐发现Li在学术上和产品上都有造假行为,具体表现在其发表在SIGGRAPH Asia 2017的论文以及real-time live中,大量使用人工手动来完成其宣称的算法自动生成的步骤



(上面几张图中的组内聊天记录显示, Li使用了“we have no choice but to cheat”, ''do it manually'', "have an artist create all 100 hairs"等语句)



在同年的SIGGRAPH realtime live demo上,面对上千观众,Li使用了疑似预计算的模型,而不是他们宣称的实时计算。


同样在面对投资者时,Pinscreen使用了疑似过度宣传的效果来骗取投资,具体表现在使用预先计算好的和人工挑选过的结果展示在投资者面前,并以此获得了softbank $3.8 million的投资。


不仅仅在于论文造假,产品虚假宣传,Li和pinscreen还存在压榨员工和学生的情况。在deadline期间,员工平均每周工作时间120小时,并没有加班费。




在了解到这些情况后,Iman决定和Li当面讨论并指出这些情况,然而得到的只是Li解雇Iman的决定作为回应。
Iman宣称在离职后还遭到了工作人员暴力抢夺笔记本电脑,导致身体多处受伤。

在Iman发出控告不久后,Li回应道 "All the allegations are 100% False."
匿名用户
匿名用户
说一下我的个人看法:我不认识HAO LI也不认识这个Iman. 但是我查了一下Iman Sadeghi的论文发表记录(比如通过DBLP),发觉这个Iman也是个牛人,在读博士期间,就发表了4篇SIGGRAPH论文(其中第一作者3篇!),这样的博士读书期间论文发表记录可以说是相当的厉害。其导师也是RENDERING领域大名鼎鼎的人物。所以这个Iman Sadeghi的总体credentials还是相当可以的。我也仔细读了长长的原文(不是知乎里这个胡乱凭凑来的帖子,而是http://www.sadeghi.com/dr-iman-sadeghi-v-pinscreen-inc-et-al/...)包括上面的许多的照片和对话截屏(都是有双下文的截屏)。伪造如此大量的截屏而且伪造HAO LI说话的特有调调?我不大相信这个伪造的说法。我倾向于相信Iman Sadeghi的说法。(另外说下,USC的以及和PINSCREEN里的人的说法,我个人是无法去相信的,所谓利益冲突方)。
知乎用户
知乎用户
只有图片证据的话,两边都别站,因为都是能中siggraph的人,伪造图片的技能树应该都点满了。
魏凌宇
围观群众一名
利益相关: Hao的博士生,即将入职Pinscreen。Iman入职后共事了一段时间。
======================
这件事终于传到知乎上了……感觉作为为数不多的会写中文而且了解整个事情的人,有必要给中文社区也澄清一下事实。
先占个位,我尽量解释清楚这件事的来龙去脉。有问题可以评论,我在底下解答。
======================
一句话总结的话,Iman Sadeghi的陈述大部分都是捏造。他提供的所谓证据有一部分是他自己用PS伪造的,聊天记录也是无视上下文地剪出来的。
另外关于论文造假和产品虚假宣传这个问题,我们半年前就已经在苹果App Store(美国区,没有中文版)上发布了与公司同名的iOS应用,任何人都可以用手机自拍然后获得由服务器即时生成的3D模型。公司后续用来宣传的图片,视频等等都是手机直接截取的,有疑问的话完全可以自己试用。
美国区应用链接:
https://itunes.apple.com/us/app/pinscreen-instant-3d-avatars/id1322184255itunes.apple.com

而解雇Iman,是因为他在入职之后长时间请假,不参与实际工作(几乎没有写过代码及审查过别人的代码),并且将别人的工作成果粉饰成自己的成果(浑水摸鱼技能满值,这个真的可以写一整天都写不完),骚扰其他员工,引起大部分员工的强烈不满等等原因。如果实在想八卦/了解细节开一个另外的问题吧。
解雇那天我不在场,但是公司的电梯和大厅的闭路电视录下了整个过程。从我看到的视频里面,他尝试抢走公司配发的工作用笔记本,并且和保安以及几个职工发生了冲突,弄伤了人。保安当时立即报警。最后警车和消防车到达,公司取回了笔记本,Iman自行离开。
======================
最后要说明的是,公司已经和学校,ACM解释清楚真相。并且已经采取法律行动。目前我知道的状态是,Iman的第一任律师已经放弃帮他打官司。他最近找了第二任律师跟Pinscreen进行交涉。
==========7/18更新============
关于截图证据,我们已经把材料都转交给了律师,在没有律师许可下我不能在这里po出来。但是可以简单说明一下,我们的论文和RTL都留有代码的历史记录,结果是完全可以复现的。同时Pinscreen一直有很多来参观的公司(投行,电影公司,游戏公司等等),有一部分人在论文截稿日之前就看到了公司内部的展示。他们也已经表达了愿意作证的意愿。
关于大家看到的生成的avatar的质量问题……确实,我们的算法并不完美,当前的结果肯定跟电影里的手工模型是有距离的(也有人提到了恐怖谷),但是相比同行的产品来说,它确实是state-of-the-art。对论文来说,文章中的效果跟App是基本一致的,而这个过程中作出的学术贡献,也是经过同行评审肯定的。App的结果和论文有差异的原因有几个,一是为了在服务器端支持多个模型并行计算,我们对算法进行了简化,去掉了占用CPU太大的步骤。二是在手机上因为手机硬件的限制,我们的渲染程序(shader)也作出了一定的简化。我们的合作公司,当然也都是基于App的质量对我们进行评估的。这一点不涉及造假。
==========7/19更新============
关于截图再说两句吧。manual processing跟cheating/fabrication是两回事,但是Iman提供的截图都在有意误导,刻意把人工的部分跟造假划上等号。
例如头发,很多人已经提到了“训练数据”。大家如果有基本的机器学习的知识,就知道训练数据大部分都需要人工生成/干预。市面上没有足够多的高质量的头发模型,所以我们聘请模型师人工建了一个更大的数据集。论文中的算法是通过学习,去找到与输入最为匹配的3d模型,并进行变形等调整。所以算法的执行不是人工的。这些都已经清楚地写在了论文里面。同时这种data-driven(加上refinement)的方法也是学界经常采用的,例如浙大的AutoHair。
还有关于牙齿/舌头等等的非核心部分,论文里已经说明了对所有输入都是用的同一套asset。这个当然是人工做的,但是Iman也宣称这是造假。我只能认为他对算法缺乏基本的了解,或者在故意装傻。
另外,不管聊天记录里说了什么,是否玩笑,都不能也不应该和论文具体实现直接挂钩。我本人非常期待USC和ACM的调查结果。
知乎用户
知乎用户
我是Hao的学生,不过我没有参与到他公司的内容,也不清楚公司内部的事情。单论我这个PhD讲道理的话我每天浪的飞起的不存在工作120个小时的问题。。。。。。。。。。。。

很遗憾他们控诉双方工作矛盾上升到这个程度,并且都有点名气,也都是科研人员里面熟于运用社交媒体的人物。最终诉诸于这样的指控方法,也为公众所知,本身是一件挺尴尬的事情。

商业和法律规章上的对错与否,应由官司来定,估计台面下面双方的律师也在运作了;学术诚信上的追究,应该由会议、校方的仲裁委员会和同行代表商议决断。指控不代表有罪,传闻和记录也需要经过公证才可辨其真伪和分量。
从一个旁观者的角度说,此时真伪对错立论尚早,还需要看过双方的正式证词和辩论之后才能定夺。Iman的网站上贴出了此次Jurisdiction的法庭,真心关心关注这件事的同学可以看庭审。

他俩以前也是盆友,我跟Iman吃过饭Ins还互粉了(这家伙Ins是个网红哦),希望他们能找到一个好的方式解决这个问题。人言可畏,学术圈名声为重。在我和Hao的接触中,我认为他是一个对学术、对诚信很严格的人。Hao一直跟我说他对我的培养不光是提高科研能力,更重要的是build up your reputation,让别人知道你了解你,这样机会才会自己找上你。科研之外Hao也确实帮我建立了不少connection。老Hao挺有名气,想必这件事难免成为一段笑谈,也望同学们能理性看待这件事。

最后加一句屁话:我在这件官司上没帮Hao说好话是因为我真的不知情,是和知乎大部分观众一样的不知情。我不知情->推出 我没法帮Hao讲话,"我没法帮Hao讲话"能推出什么你们教教我? 人要对自己讲的话负责,衷心祝愿大家丰富跃进的想象力可以多为时代添砖加瓦。


我加一下我在新智元下的留言吧。我其实不太喜欢讲个人观点,因为我认为公开场合评价一个事情应该要客观的,知之为知之不知为不知,摸棱两可的话讲出来难免会有偏差。每个人因为自己立场、经历的不同有不同的见解甚至偏见是很正常的事情。只是希望能平和、客观地说说我眼中Hao的两件事情,给大家更多的观点以参考:
我是Hao的博士生Zeng,16年本科毕业的时候申请了他的PhD。他是一个在德国出生长大的华裔,面对汉字是一脸懵逼。
去年冬天Siggraph 提交论文截止日期前的时候我自己有一项人体三维重建的工作有了挺好的结果。当时我很着急,因为我在博士二年级一定要过Screen考试,得有一篇一作。博后师兄们也乐于帮我一起写论文。我们当时的draft已经写好,文章除了最终版本实验数据和贴图基本上定型了。但是最后一周前的小会上我向Hao展示,大部分结果都没问题,但是有几个人的胳膊肘下面还有像刺一样的东西很难看,Hao就说不行不能投! 当时我蛮难过的,后来几个博后安慰我好久,都差点想不读博了。我在我们实验室,开个小跑车,天黑准时溜,满洛杉矶浪,这是出了名的哈哈。
Hao的公司内部我完全不了解,他公司的东西也不跟我说不让我做。这事最后怎么办,要看法院和学术委员会怎么判了。挺难过的,希望Hao能好好的defend他自己。Hao很看重名声的,他一直跟我讲除了埋头做科研还要build up reputation,这样别人才会认可你机会才会自己找上你。他也是确实这么帮我的——他帮我介绍了很多业界的前辈,也让我赢得了在Facebook Research实习的机会。我喜欢摄影和绘画,于是他就让我和Photoshop背后的工程师和科学家直接讲上话了,一聊起来都是他当年的 “老战友” 。Hao不是华人,除了因为发型和行事风格被媒体猎奇报道外,国内大部分人其实是不了解他的,他也很少来大陆;然而我周围相关工业界和学术界的人还是很认可Hao的名气的。
我觉得无论干啥事情被人质疑是难免的,但是也不是件坏事,重要的是沟通好、在观点的碰撞里面寻找自己的立论和态度。希望大家能全面地、理性地看待这件事情,这也是我们这些科研工作人员、以及科学媒体所追求的精神。
匿名用户
匿名用户
大家别喷这些孩子了,其实他们洗地不是为了挽救教授,是为了挽救自己而已。
Li老板的事情,在创业圈就是鸡毛蒜皮的日常。但是在学术圈这样操作,基本上命运已经不属于自己可控范围了。学术界是很玄妙的存在,私下里说什么做什大家都有默契,正规培训出来的PhD大原则也不会有问题,但是留下文字的track是大忌。Li老板也是单纯,多打电话少发信息这点,确实没有做好。
最可怕的是时间点,六年AP,马上应该要评tenure,USC即使是富家私校,也很难不顾及这种实名举报。USC决定要保Li老板,和决定放弃Li老板,其实损失差不多。50%50%的命运,真的很难靠学生PR团队影响什么了,尤其是在逼乎(reddit上去洗一洗好不好啊)。
Li老板的后手,明显是跟网红空姐老婆全职创业,其实也是很好的出路。
在这里我只想抱着同理心跟同学们讲一句:
帮洗地是好的, 但是也帮自己想想后路,假设出现最坏情况,是忠心耿耿地加入P家全职,还是quit了去G,F,甚至Snap赚大钱,还是在USC另谋高就,这时候是想想自己想做什么,是否enjoy过去生活的最佳时间。Hao的学生这么多,你们觉得有没有人找Joseph聊天呢,咱中国孩子们不要一心忠心护主,最后却沦落到无家可归的田地啊。
其实做最坏的打算,你们实力都很强,不用担心之后的出路。好好做research,你们的Reputation不会被伤害。几年前Princeton的事情不就是最好的例子吗?
Narci
一个二次元死肥宅
Liwen Hu,USC phd学生,跟着Hao五年了,算是在Hao来USC之后就一起共事了。简单来说这就是一个“前员工被开除后不甘心报复的故事”

开除Iman的时候在Pinscreen实习,也近距离鉴证了Iman被开除当天的全部经过。开除Iman的原因是因为他基本上不干活,然后一些其他的事,比如在和投资者一起的晚餐上吸大麻之类的(2017年的时候好像在加州还不合法吧)。
他半年来写过的代码不超过应该不超过500行吧(数了下两个文件,Unity3D里面的两个关于头发的rendering,一共325行)。期间写头发的rendering的时候有一个bug改了两周左右被另一个同事改出来了,但他和Hao炫耀说自己花了很大的功夫改出了bug。实习期间我就坐在他的左手边,有和他密切合作过。交给他做的事会先拖两天,然后再交给其他本科intern做(本科生比较好欺负吧)。所以开除他并不是Hao一个人的意见,是当时所有fulltime和intern都同意的。
被开除后,他想拿着公司的笔记本离开,我们说可以让他现场先把笔记本里面自己的资料拷贝走,然后把笔记本留下来。但是他不听,把笔记本装在包里面执意要带走。结果在楼下门口的时候想要拦住他拿回笔记本的时候公司的一个女生被他打了。女生被打之后我们叫了消防车和警察过来,而且有监控录像。

关于文章嘛,反正有个app,想看效果的可以直接去下载看。老实说那篇文章也就是一个system的文章,把之前做脸的state-of-the-art和做头发的state-of-the-art合在一起然后再稍微改进一下,算法上的contribution并没有多大。没啥技术含量,没有造假也没有必要造假。简单讲,把我们2017的CVPR和autohair合在一起,就基本上就是我们那篇文章的算法了。文章能中运气因素很大吧(我自己审文章的时候对system的paper都不是很感兴趣)。

关于截图,和Hao一起待了5年,他就这性格。在skype上聊天的时候他一直都是满嘴垃圾话,我都被“fxxk”过几次。因为和我们年龄差不多,所以聊天的时候并没有明显的上级和下级的区别。个人还蛮喜欢这种风格的。

关于压榨学生,想问你们deadline的时候都不熬夜的么。。。在实验室睡觉不是很正常的事么。。。phd不都是被deadline驱动的么。。平时的早上睡到10点去办公室,看看微博刷刷知乎,吃个午饭睡个午觉,看两篇论文写两行代码,于是就可以吃晚饭回家了。deadline前才会有效率干活的啊。
阿哲
IT工程师
很简单,聊天记录是不是真的。知乎上有大神解释过,PS是很难不留下痕迹的。考虑到是图形相关邻域专业人士,可能能仿造出完美截图,那服务器上聊天记录总不会也是假的吧?

至于其它诸于人品好坏,说实话都不是重点。
李扬彦
写代码跑起来
搞论文,over claim,中。
搞投资,over claim,中。
挖墙脚,over claim,卒。

PS:原文可谓学术圈+创业圈浮世绘,强烈建议大家看一看。
----
补充一下:本事件最终裁定没有出来,所以到底具体到本事见到底是怎么回事还不得而知。我想说的是,据我所见,在大小公司的PR中,在各大学术会议/期刊的论文(arXiv上的就更不用说了)中,over claim比比皆是。作为吃瓜群众,需要时刻注意去伪存真。作为科研工作者,需要更加敬畏科学与准则。为了不给别有用心的人留下把柄,开源--完整--的代码与数据,实现--无痛--的复现是极好的。
匿名用户
匿名用户
http://sadeghi.com/dr-iman-sadeghi-v-pinscreen-inc-et-al/#visualtldrsadeghi.com

对比高亮的那位Hao Li学生的回答,起码Iman是证据十足,事情起因和结果是有逻辑的。其实不光Hao Li,常年霸占siggraph的另一位浙大明星教授团队做的东西,也绝对有问题(他们也成立了公司,好巧,不知道是不是Hao Li说的super jealous的那个导师)。这位教授的文章也有一个类似的特点,绝对不公开implementation,有选择性公开数据集,数据集里有明显错误(有几个样本眼睛和眉毛的顺序都是错的),但是论文中的结果确实对的,训练数据是PS出来的。有兴趣可以去看基于FaceWarehouse那篇文章displaced dynamic expression regression的训练集,PS结果应该很明显。只闭一只眼的眨眼动作,整个face的appearance都是错的,只有眼睛是PS出来闭上的。大家都知道,只闭一只眼,半张脸都是会动的,绝对不是把单只眼的眼皮PS闭上就可以当ground truth的。不知道为什么他们的方法就有如此神力可以从错误的结果训练出正确的模型。(见图,数据集大半都是这种PS)
同时,虽然我对他们关于头发的文章没有深入了解,但是我做头发的同事也跟我表达过类似的想法,implementation细节从不公开,论文结果too good to be true。

发了这么多牢骚,只是想说,常年科研与商业化的实战经验已经告诉我,绝对不能迷信顶会文章和明星团队,很多人为了出人头地和更多名利都是没有下限的。

===============================================================
补充:针对有人说看了一下文章试了一下demo感觉可以,所以PS一下扩充训练数据没有问题。我们是真正当年文章刚出来的时候就去重现的,每一步的细节都可以说非常了解。当然后边他们肯定有很多incremental improvement,慢慢的效果越来越好了,就跟Hao Li说的一样fake it until you make it,我不质疑他们后来的方法效果很完美,我只是表示这种fake it until you make it的操作是有害学术圈和创业圈健康的。Iman发出来的截图中,Hao Li说到: "Li stated that one of his goals was to have “Loom.ai and ObEN to stop even trying to compete with us.” Li expressed concerns that Pinscreen’s actual automatic hair shape estimation could have poor quality and would “make us look bad” and claimed that “Loom.ai will laugh at us.” Li later made similar statements to the team until a few days before the RTL demo. (Exhibit E29)"
这样的做法,我觉得还是欠妥吧
===============================================================
补充2:好吧,保护数据被采集者隐私图片删了。利益相关者能不能心态放平正常讨论一下,一定要过嘴瘾?
我觉得你所说的“有鬼会公开数据集”这就好像跟近年来做vision research所强调的可重现性有矛盾了吧 :) 手动PS和自动WARP,有什么区别呢?最后都是不真实的训练数据,demo都是完美的效果,确定做demo的时候没有training dataset一不小心leak到test dataset吗 ? :)给demo里的人单独标点训练样本这种小技巧,本来无伤大雅,只是我觉得不应该提倡,请利益相关者不要这么激动。。。从这种质量的数据训练出来的模型generalization能力真的这么好吗?cascaded pose regression真有这种神力?原谅我确实智商低,不如浙大的博士啊。
===============================================================
补充3: 没想到Cao Chen都来答了,失敬失敬。我觉得我的措辞没说你们造假啊,只是说结果包装方法可能欠妥。为什么这么innovative,效果这么好的数据增强方法,文章提都不提一下呢(文章中levenberg marquardt 加个l2都要扯一下)。这个数据增强是重现论文这么至关重要的步骤的话,为什么根本不提?学术论文的目的难道不是造福community,跟大家分享你的知识吗?如果你的方法没有这么完美,一定要数据增强为什么不写出来!!!所以训练数据当然也不敢放出来了对不对!!!这是学术文章,不是你们实验室的软文去sig打广告用的,为什么会觉得这种操作毫无问题?文章的可复现性难道不重要吗?你这不是游走在造假边缘吗?是,demo效果是好了,那你的“学术文章”呢?所以说到底,你们的做法无非是没有Hao Li他们那么出格罢了。没想到利益相关者这么敏感,居然分分钟跳出来疯狂举报折叠。

Disney Zurich那篇为什么他们要用optical flow dense tracking呢。。。如果效果都如demo中这么完美,费那个劲干嘛。。。他们的Mimicry(mimikry? or some other play on words)最终也没放出来嘛。。。

要这么说,Hao Li他们也有很多很好看的face tracking demo,我也试过,确实也能用,大家都喜欢,很轰动。只是没有论文说的那么神奇嘛。。。他们做的不对的地方就是,不满足于包装demo使用的小技巧了,直接造假。答主我们实验室自己也包装的,除了某些看似很符合模型特性的failure case,其他的failure case我们也不放的:)匿名蹭热点是我的锅,我错了。咱们正常讨论嘛,又没诽谤跟Hao Li一样完全造假

pps: 你的demo和迪士尼的demo我现场都玩过的哦,效果确实不错,但是没有demo那么完美嘛
===============================================================
补充4: 有部分人总攻击我的观点说我是歪曲事实。那事实胜于雄辩,请把DDE的数据全部都公布出来大家训练下看看呗,Facewarehouse的model不给,我们拿着你2D的训练数据怎么验证你3D的效果?就当造福vision&graphics社区了。都不用公开代码。如果大家都训练得出来你demo里的效果,那是我智商低,实现有问题。我取消匿名给相关人员正式道歉。可是,你一直都不敢开放数据给大家啊。。。可能当时你给了我们是觉得我们挺牛P的,可能会给你带来更多利益。因为据我所知其他很多小实验室的人找你们要数据你们都不给的哦。

你这不就跟Hao Li一样的心态嘛。招了Iman,以为可以借他在头发方面的名气去帮自己瞒天过海骗钱,结果人家良心过意不去把事情抖出来了。你有选择的给了我们数据集,是不是也以为大家都心照不宣,不会质疑你呢:)
===============================================================
补充5: 另一位大神Qiming Hou也来了,确实work,这个trick既然这么赞,而且这么“新颖”的数据增强方式,为什么论文不写呢。:)别人看了你们论文建个数据集,不知道这个trick,还会不会work呢?。我多次强调不是质疑你们东西没做出来完全造假,是说你们写文章的小操作可能对research community的健康来说是不值得提倡的,文章不应该只报喜不报忧。Cao Chen和Qiming Hou说的话都很中肯,而且Qiming Hou正面回答了文章重现的问题,值得尊敬。但是不知道为什么有些利益看起来貌似没有那么相关的的人,说话这么难听。。。。所以我才再三补充

pps: 距DDE发表这么多年过去了,code都用到production里了,请问有发现当年公布出来的数据集里有好几个标错了的样本吗?lfw和ibug之类的人家都有勘误的哦,也希望你们仔细点,能更新一下,撑起国内一流实验室的台面哦。站在金字塔尖难免会有人出来criticize的:)也希望你们周老板不要像Hao Li一样作为sig的评审把自己审到的文章拿来给学生说
===============================================================
匿名用户
匿名用户
有好多hao li的学生说这是iman伪造ps的聊天记录。细思极恐的是这些很多是hao li和iman的私人聊天记录,你们是怎么这么笃定聊天记录是ps的?难道这些学生都清清楚楚自己老板所有的聊天记录?
匿名用户
匿名用户
作为一个不明真相的吃瓜群众,出了罗生门的时候就又回忆起当村民的夜晚,法官的判决应该会比较贴近真实,但是理亏的一方应该会尽量庭外和解,而这种结局的概率还是很大的。
有几位答主建议尝试 App,但是我看来App好用与否都无助于我们了解paper和rtl到底是否有造假嫌疑。学术造假是这里我最关注的内容,也应该是争执的焦点,决定了Hao的学术生涯的关键。其余的超时加班什么的,想必大家也习以为常了。

八卦很快就会淡忘,但是这个事情,如果说给了我什么启示,那就是应该更强调论文结果的可复现性,科研的“科”字还是要谨记。如果通过这个争端,让图形学社区里面的大家更关注代码和数据的的开放共享,至少是论文结果的可复现性(复现问题已经给许多个领域,在整体上,造成打击),也是好的。