资讯参考,东方金报

微信
手机版
东方金报

方舟要过万重山

作者 :灵媛 2023-07-01 12:15:49 围观 : 评论



半个月前,AMD的苏姿丰发布了新款大语言模型GPU MI300X,据说比Nvidia的H100更小更快。

说起来,美国朋友追求又小又快已经很多年了。

最近浙江人民出版社的朋友寄给我一本《芯片战争》,说你看看。我说我看过英文版,总是打开又合上,合上又打开。他说你是看不懂英文吗?看不起谁呢,my English is fine thank you, and you?

中文版的《芯片战争》翻译的不错,作者用一个个芯片发展史上的历史故事告诉读者,为什么靠砸钱和堆人搞不出芯片产业。

因为整个行业的分工极为细密,背后是一个极其复杂的商业生态系统,这个系统不可能源于任何政府扶持,也不可能有任何国家做到全产业链独立自主,它依靠的是企业家们像生物演化一样的:

自行冒险和优胜劣汰。

中国人是不缺优胜劣汰的,缺不缺冒险精神,网上一直争论不休。要说不缺吧,考公的人是越来越多,要说缺吧,ChatGPT大火之后的短短几个月内,国内光是上市公司就有9个老板说自己要搞大模型后随即离婚的,导致原本就不富裕的存量夫妻数量因此雪上加霜。

最重要的是,你看AI芯片最核心的三个大拿黄仁勋、苏姿丰和张忠谋都是华裔。再具体一点,他们都是胡建裔。

昨天,字节跳动旗下的火山引擎开了个大模型发布会。国内别的大模型起名都文文静静的,什么文心、混元、通义,唯独火山引擎给自己的大模型平台起了个去哪个国家都不要签证的名字:

方舟。

搞AI,果真还是要靠纯血胡建朋友。

1

自从几万年前人类征服了蓝色星球之后,仰望星空后的好奇促使大家做了一个违反祖宗的决定——暴露自己,不顾黑暗森林法则。

至于为什么这么做,千百年来从哲学家到科学家做过很多解释,主要是因为太过孤独。

为了对抗集体孤独感,除了寻找地球之外的智慧生命,还有就是试图给自己之外的东西注入神性。

从远古神话里出现的黄金机器人到雪莱的《科学怪人》,从亚里士多德的三段论逻辑到微积分发明人莱布尼兹试图设计一种普适性语言,经历了几千年的探索,即便在计算机技术不断进步后,人类还经历了无数次挫败。

具体到怎么让机器人和人自然对话甚至完成交办的任务这方面,直到2017年,谷歌的一篇论文《Attention is all you need》,才算是真正打开了局面。

这篇论文看起来很简洁,主要就是讲Transformer(翻译器)是怎么工作的,这个Transformer就是ChatGPT里的T。

有了可以验证的理论,大家就把大语言模型的训练实现基本简化为了两个要素:

◐◐◐◐●☛█▼▲◐◐◐◐●☛█▼▲◐◐◐◐●☛█▼▲东方金报网HtTp://WWW.dfjb.net▼▲▼▲▼▲▼▲▼▲▼▲▼▲▼▲▼▲

语料和算力。

简单点来说,先要有足够多的文字内容,然后要规划学习方法,比如自己学习,工程师监督学习和用户反馈后的强化学习。看起来和人类学习过程差不多,但机器学习是可以开挂的,想让它加快学习过程,就要上算力,大幅提升训练速度。

比如为了训练ChatGPT-3,微软给OpenAI配了10000张A100显卡,单次训练成本上千万美元,这个我们中国人理解起来一点也不难。想让孩子上清北吗?从小学开始就要择校,吃好的用好的还要报各种班。

去年底ChatGPT大火之前,连搞AI的人自己都在怀疑自己。阿里云在去年降价了6次,GPU租用价格下降了两成,腾讯也直接砍掉了对NVIDIA GPU的采购单。

然后,ChatGPT火了,大家纷纷宣布我也行,我也能上。最夸张的是很善于做全家桶的周总,他说:

比尔·盖茨都没我看得准。

20多年前,从亚马逊诞生到阿里巴巴诞生,大概用了5年;从有ICQ到腾讯有OICQ,大概用了两年;从谷歌诞生到百度诞生,大概用了15个月。

从ChatGPT大火到比尔·盖茨都没我看得准用了多久呢?一个季度。

大家树新风的样子,像极了在大集上喝早酒的山东朋友。一开始,镜头前的本地大哥都是配着羊汤喝瓶啤酒或者二两白酒。后来,出现了一碗羊汤配一斤散篓子的大妈和两斤散篓子的大爷。到最后,有个大哥抱了一桶十斤装的白酒告诉拍摄者:

这是我一天的量。



只有少数还没上头的。媒体问字节副总裁杨震原有没有开发大模型,杨震原会说我们在学习。被问到大模型进展怎么样,他说很初级、不成熟。

腾讯也是一贯的务实风格。马化腾说对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地,目前我们还在做一些思考。我感觉现在有很多公司太急了,感觉是为了提振股价。

你直接报周总身份证号得了。

2

今天和一位爱摊煎饼的朋友聊天,问他房地产行业的朋友会不会搞大语言模型。他说放在以前肯定会,那会儿大家连买煎饼都是要双肠双蛋,还得多刷甜面酱。

这估计代表了大部分加入大语言模型潮流企业的心态,一开始大家都想自己做,其中有很多原因,除了赶时髦外,比如模型方担心私有化部署技术泄露,企业担心自己多年积累的数据泄密。

网络安全公司Cyberhaven做过调查,至少有 4%的员工将企业敏感数据输入 ChatGPT,敏感数据占输入内容的比例高达 11%。2023 年初,三星公司在使用 ChatGPT不到20天时,就发现其半导体设备相关机密数据被泄露,并连续发生3起类似事故。

那怎么办,难道各行各业都自己做大模型?倒也不是不行。

火山引擎的朋友给科普了一下,5年前,一家企业要搞机器学习产品,是个很复杂的系统工程。现在你从北大招个应届生,给他两天时间,他就可以完整地把一些图像识别、 pipeline能整体搭建出来,不需要给他搞低代码。而且有些行业的客户比如自动驾驶,在很多深度领域比很多大模型开发商做得更好。

但什么都自己做会面临高额的硬件成本和训练成本。很多行业并不需要非常通用的、巨大的基座模型。比如银行客服不需要模型会写代码,房产中介也不需要模型会做数学题。如果盲目买一堆GPU回来自己搞大模型,收益肯定是小于成本的。

所以在方舟的发布会上,火山引擎总裁谭待强调了大模型要用起来,不能光看参数大、效果强,使用成本一定要降下来。

翻译成大白话就是,大家没必要啥都自己从0到1,各自发挥长处就好。比如芯片制造业,从设计到生产全都自己做的英特尔和三星,现在被协同作战的AMD、高通、NVIDIA、台积电按着头打。

这里面的道理,讲得最清楚的还要说是胡建裔的黄仁勋。他反复劝说美国政商两届不要搞芯片禁令,不要逼中国搞出软硬一体的独立系统。

做生意嘛,大家要都有得赚才长久。

在ChatGPT去年底火起来之前,为什么只有字节在逆势囤GPU,其实是有逻辑脉络的,而且他们的思考比较超前。

2020年,抖音推荐广告系统开始技术架构的升级,基于Transformer实现大规模的模型训练。推荐广告核心能力必须把模型做得很深,才可以对很多事物之间的关联有好的理解。无论是技术上、还是算力上,火山引擎都做了比较充分的准备。

别人开发布会说的都是我这个大模型比ChatGPT好在哪里,火山引擎的发布会上,一直强调的却是性价比,讲得是模型精调、算力调度,还有和NVIDIA一起共同合作的 GPU 推理库 ByteTransformer 在 IEEE 国际并行和分布式处理大会(IPDPS 2023)上获得最佳论文奖等等。

10年前,各大新闻平台的销售来办公室讲的都是用户量,浏览量和投放折扣。只有今日头条的销售不一样,他们会耐心地给你讲什么是算法,一个人在头条为什么总能看到自己感兴趣的内容,这对你们公司有什么用。

10年过去了,除了A股,大概没什么变化的也只有他们了。

3

三天前,锂电池的发明者古迪纳夫去世,享年100岁。3年前,他以97岁高龄成为了诺贝尔奖历史上最年长的得主。



在看讣告时,读到了他的一句话——我们有些人就像是乌龟,走得慢,一路挣扎,到了而立之年还找不到出路。

但乌龟知道,他必须走下去。

华人特别喜欢歌颂速度。苏姿丰30岁时凭借设计铜电路替代铝电路成为了IBM CEO的技术助理;黄仁勋30岁时和两位工程师一起创立了NVIDIA。

底层文化里,华人是不可能称赞乌龟的,大家称赞的都是高大全快。

相反,德日甚至瑞典的一些企业可能产品看起来一点不起眼,一个轴承,一颗螺丝甚至一个锉刀,一捆绝缘线能钻研一辈子,但全世界工业企业都离不开他们。

当经济高速发展时,他们把自己投入大生态顺势而为,当经济进入下行周期的时候,这些企业靠着专精能力,活得也很舒服。

这种跨越周期的能力,大概就是古迪纳夫说的“乌龟”吧。

现在习惯了快的我们也慢下来了,觉得大伙面对大模型这种时代巨浪还是要有些定力,如果搞不起军备竞赛,雇不起大量的北大应届生,那还是先冷静冷静,想想大模型对自己有啥用,算清楚ROI。如果用大模型比雇人干活还要贵,还不如多招些人,也是为就业做贡献了。

这样对很多企业来说是最划算和安全的,风浪越大鱼越贵是没错,但首先要保证自己一直在船上。

HTTP://WWW.dfjb.net东方金报网采集不好玩哦◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐撒旦法师打发斯蒂芬

相关文章

  • 美艳银行家离奇坠楼亡「俄国猝死症候群」又+1
    美艳银行家离奇坠楼亡「俄国猝死症候群」又+1

    年仅28岁的俄国Loko银行副总裁贝柯娃(Kristina Baikova),上周从她莫斯科居住的11楼公寓坠楼,当场身亡,原因不详,但外界立即联想到多位俄国政商界名人相继猝死的事件,俄国当局总以「自杀」草草结案,西方媒体把这些神秘死亡命名为「俄罗斯猝死症候群」(Sudden Russia Death Syndrome),不管是政商名流、记者、异议人士,莫名丧命有如染上怪病,但谁也无法厘清什么原...

    2023-07-01 12:15:55
  • 星宇日本飞一班赚一班张国炜:今年损平明年转上市
    星宇日本飞一班赚一班张国炜:今年损平明年转上市

    星宇航空董事长张国炜今天表示,「日本航线可说飞一班赚一班」,星宇原本估计5年才能损益两平,但目前看来今年就会损平,且运气好的话会「小获利」,明年转上市机率高。星宇航空今天举办兴柜后第一场股东会,针对何时转盈议题,董事长张国炜表示,原本估计5年达损益两平,但目前看起来,今年就可以损益两平,且运气好一点,也会小获利,而日本航线可说飞一班赚一班。星宇航空今年第1季已单季转亏为盈,根据民航局公布的数据显...

    2023-07-01 12:15:52
  • 方舟要过万重山
    方舟要过万重山

    半个月前,AMD的苏姿丰发布了新款大语言模型GPU MI300X,据说比Nvidia的H100更小更快。说起来,美国朋友追求又小又快已经很多年了。最近浙江人民出版社的朋友寄给我一本《芯片战争》,说你看看。我说我看过英文版,总是打开又合上,合上又打开。他说你是看不懂英文吗?看不起谁呢,my English is fine thank you, and you?中文版的《芯片战争》翻译的不错,作者用...

    2023-07-01 12:15:49
  • 王宝强惨遭老婆偷吃他经纪人双重背叛被问「还相信爱情吗」
    王宝强惨遭老婆偷吃他经纪人双重背叛被问「还相信爱情吗」

    票房男星王宝强2016年爆出结婚7年的老婆马蓉,劈腿他最信任的经纪人宋喆,惨遭爱情与友情的双重背叛,收获无数人同情,后来离婚官司打了2年,最后他给了马蓉4000万变回自由身,他最近忙着宣传自导自演新片《八角笼中》,受访时被问到:「在经历个人人生波折后,你还相信爱情吗?」他没有回避坦率表示:「我从小到长这么大,我真的是问心无愧,我活得是坦荡的,别人可以负我,但是我不能负别人。」他表示如果自己负了别...

    2023-07-01 12:15:46
  • 为结婚负债30万,婚礼现场新娘又加码改口费,新郎忍过婚礼后开打
    为结婚负债30万,婚礼现场新娘又加码改口费,新郎忍过婚礼后开打

    01在举行婚礼时,新娘一定要给新郎和婆家留面子,有什么可以私下说。不要当着众位宾客的面让婆家人下不来台,尤其是在婚礼现场加价的行为,会让婆家很反感。陆芳(化名)就是仗着男朋友喜欢她,过于贪心。陆芳跟男朋友要车要房不说,还在婚礼现场加价,让婆家人很没有面子。就因为陆芳的一系列操作,两个人分手了。02王瑞(化名)和陆芳在一起三年了,两个人的父母也在催两个人结婚。两家人在一起谈婚论嫁时,陆芳父母说没有...

    2023-07-01 12:10:59
  • 凤凰男和妻子的婚前约定:你可以不生娃,只要别干涉我养全家6口
    凤凰男和妻子的婚前约定:你可以不生娃,只要别干涉我养全家6口

    01人们常说:“嫁人不嫁凤凰男。”为什么呢?自然是因为凤凰男身上有令人无法忍受的地方。通俗来讲,凤凰男指的是那些出身贫寒,但通过后天努力在个人成就方面跻身社会上层的男性。他们能力出众、责任心强、感情专一,但因为家庭环境的原因,他们又盲目自大、敏感多疑,甚至会有代际纠缠的问题。因此,凤凰男是一个矛盾结合体。若你能够把控住他,你们的婚姻自然是happy ending, 若你无法把控他,你们的婚姻就注...

    2023-07-01 12:10:54
  • “你不好好伺候我妈,我就离婚换个能干的”妈宝男叫嚣,妻子:好
    “你不好好伺候我妈,我就离婚换个能干的”妈宝男叫嚣,妻子:好

    01儿媳伺候婆婆是情分,也是做子女的孝顺老人的体现。只不过,儿媳对于婆婆究竟不是亲生女儿,她只是帮丈夫尽孝道,同时表达自己对老人的关怀和体贴。就算儿媳真的不伺候婆婆,法律也不可能逼她去伺候婆婆。但是对于某些男性来说,娶媳妇就是用来伺候他母亲的,不然这个媳妇就没用。小茹(化名)不愿意伺候婆婆,主要还是因为她们的关系非常差。02小茹生活在一个中西部城市周边的村镇上,她的父母在镇子上开店,经济水平一般...

    2023-07-01 12:10:49
  • 结婚前,新娘关闭手机和男闺蜜聊一整夜,第二天才知婚礼被取消了
    结婚前,新娘关闭手机和男闺蜜聊一整夜,第二天才知婚礼被取消了

    01当今社会,随着社会风气的开放,男女之间交往的界限越来越模糊,不是恋人胜似恋人的关系也变得普遍。当我们见到一对儿亲密无间的男女,以为他们是恋人时,或许对方就会告诉我们,他们只是朋友关系,而女人或许还会说男人是自己的男闺蜜。这就有些匪夷所思了。因为在过去的人眼里,男女之间稍显亲密的都是恋人关系,不是恋人关系还走得那么近,那不是耍流氓吗。但就是这种在过去的人眼里无法理解的关系,在当今社会,却变得极...

    2023-07-01 12:10:43
  • 这个西方大国,这两天全国大乱,华人也遭殃了!
    这个西方大国,这两天全国大乱,华人也遭殃了!

    在很多人看来,以色列是美国命运相关的铁杆盟友,这个国家本来就是美国所创造的,是让中东陷入战乱的重要棋子,而另一方面犹太人掌握了美国的金融与传媒体系,甚至有人认为美国已经被以色列所控制了。而事实上,以色列与美国之间早就已经出现了裂痕,而且裂痕越来越大。矛盾最初的根源,在于对伊朗的态度,这个事情,说来话长.....以色列一直认为,阿拉伯世界中,能威胁到自己的,是工业化能力与军事潜力最大的伊朗。尤其让以色列心惊胆战的就是,伊朗在发展核工业。以色列的这个担心是有道理的,因为它太小了,不用心的话,在世界地图上都找不...

    2023-07-01 11:06:58
  • 美国疯了?竟出这种事!我们如何对付这样的美国?!
    美国疯了?竟出这种事!我们如何对付这样的美国?!

    原创:占豪来源公众号:占豪微信ID:zhanhao668美国疯了!不知道现在有多少人意识到这一点,美国的确是疯了!例子太多,不想多举例了,就举两个关于美国对待俄罗斯和中国的例子。对待俄罗斯,那一系列疯狂的制裁就不说了,炸毁北溪天然气管道的恐怖主义行为也不谈了,就说一件非常“普通”的事。最近媒体爆料,美国不断策反俄罗斯的外交官,包括俄罗斯驻美大使都在策反之列。结果,美国没有达到目的,俄罗斯对此也表达了强烈不满。如果这就结束了,那也算一件阴损的事,但还算正常,但美国干出来不正常的事情是,在俄罗斯驻美外交官拒绝...

    2023-07-01 11:06:55