-
日期: 2025-06-19 | 来源: 腾讯科技 | 有0人参与评论 | 字体: 小 中 大
代表诉讼原告的克拉克森律师事务所(Clarkson Law Firm)合伙人格伦.达纳斯(Glenn Danas),把此类AI初创公司的工作条件描述为“?反乌托邦式的?”。Surge发言人则称该诉讼“?毫无根据?”。
02.从硅谷工程师到行业颠覆者
埃德温.陈在麻省理工学院攻读语言学与数学。毕业后,他先后任职于Facebook、Dropbox、谷歌和Twitter,担任机器学习工程师,主导推荐系统、搜索算法开发及训练数据采集等核心工作。这段顶级科技公司的从业经历,让他亲眼目睹了大公司在数据标注环节的现实困境。
以在Facebook工作时期为例,他曾负责开发一款Yelp竞品,团队需要训练一个能准确分类企业类型(如区分餐厅与杂货店)的模型。当时外包机构告知,完成包含5万个企业样本的精准标注数据集需要长达6个月时间。更棘手的是,最终交付的数据存在严重质量问题(如将餐厅误标为医院),这一经历直接促使他萌生了创立Surge的想法——立志解决传统数据标注行业效率与质量双低的痛点。
“我们除了等待别无他法,” 埃德温.陈说。当数据交回来时,他惊呆了:在某些情况下,餐厅被标注为咖啡店,咖啡店被标注为医院。“这些数据完全是垃圾,”他说。
2020年,他离开Twitter创立Surge,并通过硅谷创业者特有的方式——在旧金山Dogpatch社区和教会区的攀岩馆偶遇Airbnb和Neeva(一家曾被看好的AI搜索引擎初创公司)的高管,向他们推销自己的公司——获得了首批客户。
为推动Surge起步,埃德温.陈招募了此前工作中认识的数据标注合同工,并用自己的积蓄为公司注资。巧合的是,当语言模型开始变得重要时,埃德温.陈把业务聚焦于这一领域——而Scale最初则专注于为自动驾驶汽车评估更可视化的数据。
不到一年后,OpenAI就与Surge签约,聘请后者对其模型进行微调,通过基于双方共同发表的研究论文,教模型避免产生有害响应(如种族偏见语言)。到2022年,Anthropic也成为Surge的客户,该公司部分依赖Surge的合同工来评估大语言模型是否能帮助人类监控其他AI,试图在全行业开发类人AI的探索中建立安全检查机制。
数据标注还能确保模型响应的风格一致性。知情人士透露,某企业科技公司曾使用Surge的合同工编写代码行及其附带解释。这些代码和解释不仅必须正确,还需要在不同标注者的示例中保持相似的结构、长度和复杂程度,以确保该公司训练的模型能输出符合其风格的代码。
03.?行业共性与Surge的神秘护城河?
Surge的客户表示,Surge对其内部流程及快速生成高质量数据的技术细节守口如瓶,但这种情况在业内并不罕见。“这和我与云服务提供商合作时的情况一样,” 上述企业科技客户说,“我不知道他们的服务为何能如此出色的内部原理,我只需按下按钮,就会为其背后的工作成效感到高兴。”
数据标注公司通常会使用各种技术,确保合同工在回答问题时不敷衍了事。例如,这些公司会随机插入无标准答案的"陷阱题",或要求多名标注者对同一问题的正确答案达成共识。
挑选合同工同样重要,尤其是当模型开发者在计算生物学和理论物理等高级领域编写问答示例时,越来越需要受过良好教育的合同工,埃德温.陈不愿详细说明公司如何管理标注者响应的质量,但他表示,除了初始筛选流程,Surge会?持续评估合同工。他说,公司可以通过多种信号(例如承包商使用的词汇或光标移动轨迹)判断响应是否高质量。
即使在投资Scale之前,Meta也在Surge上投入了大量资金。据知情人士透露,去年,Meta的生成式AI团队向Surge支付了超过1.5亿美元?用于数据标注工作,Surge负责从始至终管理整个流程。该人士称,这与流向Scale的约2亿美元?相差不远。
?一些客户反映Surge长期处于满负荷运营状态,承接项目需预先支付数千万美元的承诺金。与此同时,OpenAI等模型开发者正通过Mercor等招聘机构自建标注团队,试图绕过第三方服务商。此外,数据标注行业的参与者数量持续增加,这一趋势已对市场价格形成下行压力——例如谷歌作为Surge的长期客户,为避免供应链依赖正拓展多供应商合作体系,并成功与Surge协商降低服务报价。
面对关于业务增长持续性的质疑,埃德温.陈显得颇为从容。他指出公众对数据标注行业存在认知偏差,普遍低估了维持高质量标准的技术门槛。他说:“人们总是想当然地认为,只要聚集10万名高学历人才——比如博士群体——让他们自由发挥就能产出优质数据。但实际情况是,未经系统化管理的人力投入,只会导致标注质量的严重参差不齐。” 在他看来,Surge构建的标准化质控体系,正是应对行业同质化竞争的核心壁垒。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见