在这十年来我国科技成就辉煌的背景下ChatGPT为何未先于中国出现未来我们能否见证其登陆中国市场

  • 手机
  • 2025年02月07日
  • 在这十年来我国科技成就的辉煌背景下,ChatGPT为何未先于中国出现?未来我们能否见证其登陆中国市场? ChatGPT的开发关键有三个方面,其实都不存在明显卡脖子的环节:算法模型。ChatGPT使用的基本都是开源,而且已经广泛使用了较长时间的模型和算法,例如Transformer,强化学习等;训练数据。个人觉得这一块是目前最大的困难,因为模型的训练需要海量且优质的语料

在这十年来我国科技成就辉煌的背景下ChatGPT为何未先于中国出现未来我们能否见证其登陆中国市场

在这十年来我国科技成就的辉煌背景下,ChatGPT为何未先于中国出现?未来我们能否见证其登陆中国市场?

ChatGPT的开发关键有三个方面,其实都不存在明显卡脖子的环节:算法模型。ChatGPT使用的基本都是开源,而且已经广泛使用了较长时间的模型和算法,例如Transformer,强化学习等;训练数据。个人觉得这一块是目前最大的困难,因为模型的训练需要海量且优质的语料,但中文的语料怎么可能被美国卡脖子?语料的整理需要时间、耐心。举一个工作中的例子,一份几千条数据的标注可能需要一周(单个标注人员可能负责多份数据标注),而由于标注标准的理解不同,中间还需要反复沟通、扯皮,最后可能标注数据还不可用。算法模型决定了效果的下限,而数据质量决定了效果的上限;算力资金。ChatGPT需要大量의GPU用于加速训练,而针对GPU的大量限制也是最近才有的,前些年我们甚至能看到一些新闻,例如某某明星创业公司宣传自己拥有几千块GPU等。关于资金,一方面是前期GPU的大量采购,另一方面是模型多次训练时的大费用的花销,都需要大量的人民币支持。

但无论是国内大型互联网公司还是政府研究部门,这一块只要真的想支持钱总还是够。但我们已经不止一次看到相关新闻,有人贪污赃款动辄上亿,或坐拥成百上千套房产。我认为ChatGPT中国落后的真正原因并非技术问题,而是在于指挥官们不完全相信技术真的能改变世界,并形成了一种信仰。这乍一听有点玄乎,但要知道ChatGPT在出现之前没有人能确定这条路是能走通得来的,而且每个版本都不一定惊艳,但耗费了大量时间和资金。

从互联网发展历史看,我国一直是一个追随者,所以Copy to China模式更容易得到信任。具体到某个项目上,如果被证明有效才更容易得到信任给予时间、人员和资金支持。而习惯短平快缺乏耐心,这两点原因并非泛泛而谈,它们对于ChatGPT开发都有着深刻影响,没有对技术充分信仰就不可能持续投入资源,没有足够耐心就无法完成高质量、高效率地进行海量数据集成。

近日市场对于AI炒作可谓陷入彻底疯狂,我们应该从现在开始重视AI发展,因为未来AI必定会对我们的生活产生巨大影响。我将针对原理、普通人的影响以及投资展开讨论。在此之前,我们首先要了解一下语言模型输出原理,它其实就是一个字一个字生成,每个字基于前文内容根据一定概率选择,所以它并不仅仅只是拷贝粘贴,更像是逐字生成结果。

再来说说三阶段学习过程:第一阶段即无监督学习,即通过阅读资料获取知识;第二阶段即有监督学习,即根据特定的任务进行专项能力提升;第三阶段即创造性训练,即提高模ellenhance能力,让它能够更加自主创新。这三步骤正如一个人从初学者到专家,从基础知识掌握到专业技能精通,再至于创造性思维,最终实现自主创新一样。

《三体》中提到的“技术爆炸”,回顾人类发展史,可以发现技术进步不是线性的,而是一系列突破性的飞跃。我国版聊天机器人会有吗?结论是肯定会,只不过是个时问。此外,我也提到了虽然开发难度小,但是是否能够迅速跟进,则取决于各大企业是否愿意投入资源,以及他们是否具备必要条件去做出这些事情。如果我国可以借鉴国际经验,加以改良,不断迭代更新,那么国产版聊天机器人很快就会成为现实,也许就在不远的一段日子里呢!

猜你喜欢