What is Nostr?
ZGfinance / 知更财经
npub1jau…wnet
2023-02-18 05:58:34

ZGfinance on Nostr: 该文来自北大校友: 我去年在西雅图微软, 而且就在负责开发 ...

该文来自北大校友:

我去年在西雅图微软, 而且就在负责开发 Bi­ng 后台一部分算法的 We­b­XT 组, 后来因为个人原因离职了. 作为了解 Ch­a­t­G­PT 和新 Bi­ng 部分内幕的底层码农, 以及 GPT-3 和 Co­d­ex 的第一批公测用户,我来谈谈对 Ch­a­t­G­PT 的看法.

1. Ch­a­t­G­PT 的算法, 包括自回归语言模型 (Op­e­n­AI 从 2017 年的 GPT-1 搞到现在, 迭代了 3.5 代了), 还有强化学习的 PPO 算法 (还记得 2018 年在 TI 表演赛上击败 OG 的 Do­ta2 AI 吗? 就是用这个算法训练的), 全都是已经十分成熟的公开算法, 本身没有任何秘密可言. 但是这种超大规模训练, 并不止依靠算法本身, 硬件和数据才是王道. 纯自然语言数据, 网上公开的到处都是, 也没有什么门槛. 但是 Ch­a­t­G­PT 有一个巨大的先发优势,就是他通过抢先开始公测,收集了大量的用户的使用数据,这是更加宝贵的数据,而这部分数据只有他们家有。只要 Ch­a­t­G­PT 仍然是最好用的语言 AI ,这个雪球只会越滚越大,越来越难追上。另外,为了防止 Ch­a­t­G­PT 输出有害信息,Op­e­n­AI 还花了大价钱去找印度和肯尼亚的外包公司标记了大量的有害文本,用来训练模型不要输出有害信息,这部分数据也是 Op­e­n­AI 积淀了几年筑起的数据壁垒。总之,小公司根本做不了 Ch­a­t­G­PT 这样的工程,凡是声称投资区区几亿就要做 Ch­a­t­G­PT 这样的 AI 的,几乎可以认为全是诈骗;真正有可能做出类似产品的,在中国只有 BAT 这种拥有自主云计算平台 (市场价租机器做这个就等着破产吧)、且掌握大量用户的互联网公司,而且最好是和 Ch­a­t­G­PT 错位竞争,比如做中国可以正常联网使用的中文模型;并且,其中最困难的部分其实是敏感词屏蔽和有害信息过滤(Ch­a­t­G­PT 的屏蔽程度,在国内恐怕是不够的,因为它仍然可能在用户恶意诱导下说出不该说的东西)

2. 再来简单聊聊微软。很多华人,都觉得微软低效是因为印度人太多,尤其是因为印度人做了CEO。但是这种言论是错误的。从 Ch­a­t­G­PT 这件事中就能看出微软现任 CEO Sa­t­ya Na­d­e­l­la 的眼界。首先,当时 Op­e­n­AI 缺钱、且做出来的东西都是 Do­ta2 AI 这种不能赚钱的东西,马斯克都甩手不干的时候,微软仍在默默地投钱、给机器。去年我还在 We­b­XT 组的时候就听说 CEO 有意向在 Bi­ng 用 Op­e­n­AI 的新模型,把我们吓得不轻。后来就听说 We­b­XT 组停了好多项目,开了好多人,把几乎所有机器都借给 Op­e­n­AI 了。因为 CEO 想拨款买新机器给 Op­e­n­AI 用,遭到很多利益相关的反对,尤其是 CFO 不给批,于是只好绕过 CFO 抽调微软原本用于研发的机器;这样 We­b­XT 人多,机器少,很多研发人员干不了活,正好再裁了这些 “多余” 的研发人员。后来的事情,大家都知道了:这个 Op­e­n­AI 的 “新模型” ,它的名字叫做 Ch­a­t­G­PT,而且火速上了 Bi­ng 。虽然我以前所在的 We­b­XT 组是这个事件中的最大受害者,但是如果作为旁观者,我的确十分佩服 Sa­t­ya Na­d­e­l­la 的眼界。

3. 有人说,Ch­a­t­G­PT 会面临 Go­o­g­le 的竞争,Go­o­g­le 的搜索引擎仍然是最好用的,Go­o­g­le 的用户是全世界最多的,Go­o­g­le 的自然语言 AI 技术也是领先的,所以完全可以等 Go­o­g­le 出竞品,也能做得很好,所以不必唱衰 Go­o­g­le 。这里的论据都是对的,但是最后一步论证 “所以不必唱衰 Go­o­g­le” 这步,没那么简单。我看了最近一个 Sa­t­ya Na­d­e­l­la 的访谈,他的大概意思是,Ch­a­t­G­PT 的技术,头部科技公司迟早都会掌握,包括 Go­o­g­le;但是 Ch­a­t­G­PT 的推断成本高昂,而且消耗的算力与用户体验高度正相关;而搜索引擎用户粘度小,用户永远会去用体验最好的那个;所以这会迫使所有科技公司搞军备竞赛,大幅推高搜索算法的成本,使得 Go­o­g­le 赖以生存的搜索广告业务再也无法躺着赚钱;但是微软的营收却更加多元化,因此受到的冲击会更小,却能享受到 Ed­ge 浏览器、甚至 Wi­n­d­o­ws 系统市场份额增加的好处。很多人还在想第一层第二层,人家 Sa­t­ya 已经想到了第五层了。说的直白一点,现在微软就是开启了大模型军备竞赛,想要卷死 Go­o­g­le。当然这并不是 “内卷”,毕竟用户的使用体验提升了。

$谷歌A(GO­O­GL)$ $微软(MS­FT)$ $浪潮信息(SZ000977)$
Author Public Key
npub1jaug2c2k0s0n4htg5yr8j8f2jq246hg5qvvps0f0j7f7a90zu5asdkwnet