反正从此前和尹芙·卡莉的交流来看。都2014了,硅谷现在开发点什么机器学习仍旧是要动不动跟哈佛、牛津之类高校合作。这些人之所以仰仗哈佛、牛津除了是指望这些高校进行下数据标注之外。主要应该就是指望着这些高校在狭义知识方面的加持了。这些人这么做也容易理解。毕竟最早涉及到自然语言处理方面的模型数据的时候人们是用狭义知识进行训练的,而不是依靠数据和算法。甚至林灰印象中,即便是前世,在互联网迅速崛起之前,人们唯一训练自然语言处理方面模型只能是用狭义知识。而林灰手中就拥有相当多的狭义知识,且水平什么的应该比现在西方世界所用的不知道高到哪里去了。从硅谷为了获取狭义知识每年砸几千万美元的架势来看。林灰手中的一些狭义知识如果能够拿来变现的话要比利用标注数据变现还方便。<huo.但这仅仅是理论上容易变现。林灰没有绝对的话语权以及随之而来的权威性。林灰怎么去向潜在的受众去说其所拥有的狭义知识资料要比现在硅谷所用的普遍材料更高明呢?其实潜在的买家林灰倒是清楚的很。要知道就算是在往后几年对大量的狭义知识感兴趣并且又不差钱的买家其实也不是特别多。林灰估计这个时空下可能对大规模狭义知识库感兴趣的买家无外乎是microsoft、Google之类的超级巨头。不过纵然是知道这些潜在买家,林灰也不可能去主动找对方啊。那样的话岂不是成为了兜售么?而兜售等于直接丧失了主动性。毕竟按照买家的思维逻辑是:兜售等同于卖家对产品不自信。亦即商品缺乏权威。对于有的商品缺乏权威等同于直接给判了死刑。买家凭什么要为缺乏权威性的内容买单呢?或许这只是林灰的臆测,但林灰觉得这种事情是大概率事件。没权威性,纵然是更高水平的东西。想拿来换钱也是很蓝的啦。而拥有了绝对的权威性,事情则不一样了。很多时候就成了卖家市场。买家上门求着那种。就像尹芙·卡莉描述下的自然语言处理方面的算法团队兴衰轮转不断。但哈佛、牛津之类的高校却始终不用担心没有算法团队去同他们进行合作。毕竟某种程度上这些顶级高校在狭义知识尤其是在部分NLp开发离不开的语言知识上几乎就等同于权威。这种情况下别说这些高校不用担心吃饭的问题。甚至是很多算法团队也得看人家脸色。拥有权威性。水平没那么高也很容易吸金。甚至是不需要这些高校亲自去产出知识。某些时候甚至可以直接对“通行知识”进行贴标。对,没错,知识贴标。这才是真正意义上的躺着赚钱。而且是躺在大气层那种。很美好,不过很遥远。不过林灰也不必要太灰心。因为涉及到话语权的追求,林灰并不孤单。和林灰同行并不是某人。而是一个五千年悠久历史的东方古国。林灰相信通过不断的求索会一天实现涉及到话语权的终极追求。理想是美好的,道路是曲折的。现在没有话语权,想要依靠一些狭义知识去换钱是很难的。除非是去找一些跟哈佛、牛津同一水准的高校,要他们为林灰背书。不过这样一来岂不是成了看别人脸色赚钱?呃……最关键的是这么一来很可能七成还是人家的。这种为他人做嫁衣的事林灰是不会搞得。在没有足够的话语权之前,想躺在大气层是不可能的了。似乎还是老实通过数据标注或者别的现实一点的手段去赚钱好一点。即便是数据标注对于林灰来说运用得当也是一笔巨大的财富了。十八世纪末期,在美国的西进运动中,人们在萨克拉门托河里发现了金砂。在勇气、贪婪的作用下,工人、农民、海员和传教士,前仆后继,前来淘金。这就是赫赫有名的“淘金热”。不过在这场轰轰烈烈的西进运动中真正依靠淘金赚到大钱的人却不见得有多少。反倒是在淘金热这一过程中另辟蹊径的卖水人赚得盆满钵满。“数据标注”这个领域某种程度上就是前世人工智能迅速崛起时的“卖水人”。为什么这么说呢?在前世人工智能迅速崛起的时候。海外大多数科技公司几乎都不约而同将目光都聚焦于追求更先进的算法、平台框架建设、商业化。“数据标注”作为一条既不瑰丽也不独特的领域。纵然数据标注在机器学习尤其是监督学习中扮演着相当重要的工作。但数据标注这个领域依然让很多海外科技公司不屑一顾。甚至是很多海外巨头以及前世一些专门搞人工智能的海外公司对数据标注也是不屑一顾。或者也不是不屑于顾,只是选择性无视罢了。毕竟在很多海外科技公司眼中看来数据标注是一项吃力不讨好的体力活。而投资者因为对数据标注不甚了解。也往往对数据标注这一领域不甚关注。反而是那些以技术为核心或者说ppt上以技术为核心的科技公司反倒是更容易脱颖而出并受到投资者青睐。然而在前世当人工智能喧嚣的风头不再。褪去华丽的外衣之后再看一众人工智能行业各从业公司时。会发现曾经那些大张旗鼓追求先进算法、商业化以及平台框架建设的海外公司不见得有多少赚钱的。反倒是从事于数据标注这方面的一些当初不怎么上台面的海外小公司赚得盆满钵满。甚至于还出现了一些估值能够达到七十亿美元左右的独角兽公司。虽然估值这种东西一般有不少的水分。但作为一个人工智能有关的公司估值七十亿美元也差不多了。