扎克伯格(Zuckerberg)与1000亿元人民币“偷猎”:
作者:365bet体育 日期:2025/06/21 09:45 浏览:
该公司主要帮助AI模型准备培训数据。它就像外包数据清洁 +标签,没有技术内容。但是,低调和无聊的工作已成为AI期间应进行的资源。
GPT,GEMINI和LLAMA等大型模型应以高质量的培训数据提供数百亿个令牌。 AI量表就像“工业清洁数据”,处理原始的网页,文档,音频和视频剪辑,噪声过滤,作弊,然后在模型系统中对其进行分类和输出。
如果此过程中发生1%的错误,则模型的质量可能会损失。
可以制作AI标签系统:
准确性高达99.7%,行业的平均值仅为85%。
处理数千万数据日,涵盖了217种语言,图像,动作和语音场景;
后端由成千上万的“标记”外包组成,分布在菲律宾,菲律宾,印度,肯尼亚和委内瑞拉...
元试图建立一个在过去的两年中,Imaril的系统,发现它很昂贵,制作电影和不稳定的劳动力。它只是防止自我训练数据组,并取决于尺度AI。
那么,扎克伯格“赌博”的来源是什么?为什么其创始人成为硅谷中最重要的年轻人?
答案是:中国天才亚历山德·王(Alexandr Wang)只有28岁,已经从麻省理工学院(MIT)上学,被称为“硅谷最强大的数据业务”。
在不到十年的时间里,在工业链中成为非人工智能公司的数据注释。甚至五角大楼也成为了他的客户,甚至Openai都使用了他的培训。
目前,扎克伯格直接向她介绍了AI生命线。问题是,王能承受吗?他是如何制作这种游戏风格的?
一个才华横溢的中国天才
亚历山德·王(Alexandr Wang)的创业起点类似于“ AI行业中的数据砖砌家”。
她出生了在美国新墨西哥州的一个物理研究镇,她的父母在国家实验室担任核物理。她喜欢中学的编程和研究斯坦福大学毕业前的计算课程。
他在17岁时进入了麻省理工学院。在第一学期,他参加了课堂学习水平,并在完成之前就退出了学校 - 不是因为纳比(Nabhe)在这个话题上,但是因为他有一个想法,他想做这么多。
原因也很简单:他想在冰箱中安装摄像头,以监视“牛奶是否几乎完成了?”实时。事实证明,没有足够的数据来训练系统。
因此,他考虑了这一点:数据将是未来20年中AI的主要障碍之一。
2016年,他离开了麻省理工学院,进入了硅谷最热的孵化器商人Y组合。在招募人员并建立平台时,他建立了一个规模AI。他的使命非常直接:提供基本的服务用于标记和清洁AI模型的数据的恶习。
为了空白,它是从事“ AI数据外包”。
早期的团队无法接触10人,Wang谈论Araw的客户,在夜间建立系统,并参加人造质量检查。
这很简单,但这很复杂。但是,王有极高的质量要求:一旦错误率超过1%,再次返工;只要客户体验不好,Manu -follow。
在这种“决定性质量管理”中,AI量表逐渐赢得了越来越多的客户:
2018年,他成为OpenAI的早期培训数据提供商;
2019年,特斯拉(Tesla)将FSD(自主驾驶)注释数据大规模外包;
从2020年开始,美国国防部从中购买了服务,以表彰军事形象和卫星标签;
像2024Oyota和通用汽车。
最不幸的是,它不仅出售“数据”,而且将整个“数据链接”变成了产品。
王已经开发了一个完整的数据操作系统 - 包括数据收集,清洁,缩小,标签,分类,上传,上传,动态更新...以及全部自动并协调以减少MANU -MANU -MANU -MANU -DISTRONTION。
它使比例成为世界上唯一可以提供有关大型工业规模的高质量AI培训数据的平台。
这不是“全部-up -fold”服务,而是由“ Technology + System + Scale”产生的障碍。
2021年,Safor AI完成了最新的融资轮换,其赞赏增加到了70亿美元。王只有25岁,出现在福布斯的“ 30岁以下的世界30个技术人物”中。
扎克伯格没有时间
到目前为止,当外部世界看到元与规模AI之间的约束力时,许多人认为这是“高价外包”,但实际上,它比您更紧急Hink。
近年来,META在AI的布局中并没有缓慢:
图灵奖莱肯(Lecun)的获胜者正在招募领导AI实验室博览会;
Llama 1、2和3被释放,以进入Big Model的开源;
自我开发的硬件(例如MTIA AI芯片)和新的计算能力基础架构也会立即促进。
但是问题是 - 它们都没有成为主要力量。
尽管美洲驼以圆圈而闻名,但在实际商业用途中,它低于Openai和Claude的人类观点。
博览会团队的学术环境很强,有很多论文和小型MGA产品,其实施能力却很沮丧。
尽管META来自Facebook和Instagram的大量数据,但其质量是不稳定和高版权风险的,因此它无法直接用于培训。
到2024年初,扎克伯格(Zuckerberg)发现,如果继续进行,Llama 4将没有时间上网,并且元数据可能会完全错过AI窗口。
此时,他终于做出了决定:停止独自制定数据,直接将最高工厂数据扩展 - 缩放AI。
它不是由疯子驱动的,而是看到清晰的趋势:
AI结果的关键是,不再是人类算法是最聪明的算法,而是谁能喂养大型模型,谁能迅速练习;
控制数据输入的任何人都是Mathere是AI战斗状况的一项倡议。
比例AI发生在此入口。
它可以为模型提供最低成本,最快效率和最稳定质量的所有“数据燃料”所需的“数据燃料”。元缺乏这种能力。
更重要的是,王保持运营,并继续为外界提供服务。
换句话说,扎克伯格依靠表面上的供应商,但实际上,他将“加油站”放在他自己的地图范围内的AI字段中。
当元数据获得数据供应的数据链控制时,骆驼的训练节奏将不再是被动的。
但这也是我请访问情况即将改变:
Google计划结束与Scale AI合作的计划,因为Openai加速了对竞争对手竞争对手握手的支持;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;该公司的其他大型模型开始审查“数据依赖性”,并会记住他们的燃料资源随时“扩展”。
这次合作背后的赢家是亚历山大·王(Alexandr Wang),最初称为“ AI Brick Overt Man”。
她已经在战场上拥有独特的地位:
可以同时向OpenAI,Meta和美国国防部提供数据;
具有最完整的数据,标签和配电系统的清洁;
“数据调度指挥官”可以提高100,000个优势 - tao和数千个GPU。
结论
目前,扎克伯格(Zuckerberg)对亚历山大·王(Alexandr Wang)的赌注不仅要购买服务,还希望他能拯救美洲驼。
但是王想做的是构建一个“数据操作系统”,使巨人能够生存。
一方面,这是硅谷和O的最消费者消费者Thernda,这是最平静的供应商。
我们将来会看到这种舞蹈,如果我们与Openai作斗争或再次互相抗争,我们就会接近。
但是,此时餐桌上的商人可能不是Altman或Zuckerberg,但中国男孩从分数开始。回到Sohu看看更多