首页 500强 活动 榜单 商业 科技 领导力 专题 品牌中心
杂志订阅

OpenAI:不会借助用户语音数据训练人工智能

JENN BRICE
2024-12-20

OpenAI表示,它不会利用通过其新推出的ChatGPT电话服务收集到的消费者声音数据来训练相关技术。

文本设置
小号
默认
大号
Plus(0条)

OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)。图片来源:DUSTIN CHAMBERS—BLOOMBERG/GETTY IMAGES

OpenAI表示,它不会利用通过其新推出的ChatGPT电话服务收集到的消费者声音数据来训练相关技术。

OpenAI的一位发言人告诉《财富》杂志,OpenAI并未利用1-800-ChatGPT服务的“通话、通话记录和WhatsApp消息”进行训练。这是一项于周三推出的复古式服务,消费者可以通过拨打指定的电话号码,以电话交流的方式与聊天机器人互动,进而访问这款备受欢迎的生成式人工智能应用程序。

许多观察人士认为,这项服务的推出至少在一定程度上是为了帮助OpenAI收集大量的语音数据,这些数据涵盖拥有不同口音、语音模式的人们,以及多样化的背景噪音。对于OpenAI、谷歌(Google)、Meta和苹果(Apple)等致力于开发新型“多模态”人工智能服务的公司而言,语音识别质量是一项重要特征。而提供免费电话服务以收集语音数据,则是谷歌首创的一项屡试不爽的硅谷技术。

谷歌于2007年推出了谷歌语音本地搜索服务(GOOG-411)。美国和加拿大用户可以通过拨打免费电话,获取镇上某家特定企业的地址、联系方式及营业时间等信息,或是“礼品店”或“牛排馆”等类别的商店或餐馆列表。

这项谷歌提供的工具服务是免费的,不像当时的电话公司对411服务收取一美元以上的费用。不过,GOOG-411的来电者提供的是他们的语音数据。谷歌利用来电者的语音数据建立了一个音素数据库,以改进其语音识别技术,该技术后来被整合到安卓手机软件等产品中。

现在就拨打电话!电话:1-800-ChatGPT

市值高达1570亿美元的OpenAI周三推出了ChatGPT电话服务,这是其所谓的为期12天的“ship-mas”活动的一部分。在此期间,该公司每天都会推出一款新产品或一项新功能。该系列活动的其他亮点还包括向所有用户开放Sora视频工具。

OpenAI首席产品官凯文·威尔(Kevin Weil)称,这项新推出的电话服务旨在让ChatGPT技术惠及更广泛的公众。威尔周三在直播中说:“我们的目标之一是让这项技术尽可能地普及。”

从周三开始,美国用户能够通过拨打1-800-CHATGPT咨询聊天机器人。全球其他地区的用户则可通过WhatsApp拨打此号码享受同样服务。OpenAI表示,所有拨打该热线的用户均可享受每月15分钟的免费通话时长。

在接通电话时,聊天机器人会以这样的问候语开场:“您好,我是人工智能助手ChatGPT。为了安全起见,我们的通话可能会被审查。选择继续通话即表示您同意OpenAI的条款和隐私政策。那么,请问有什么可以帮助您的吗?”

根据上述隐私政策,OpenAI根据用户和研究人员提供的信息、第三方合作伙伴数据和公开的互联网内容来训练其基础模型。因此,尽管该公司未来可能会调整策略,利用通话数据来训练其人工智能技术,但OpenAI发言人表示,该公司目前还没有开始使用通话数据进行训练的计划。

Nomad Data首席执行官布拉德·施耐德(Brad Schneider)在接受《财富》杂志采访时表示,1-800-ChatGPT是一种极具“智慧”的手段,能够促使用户使用语音功能,进而构建其语音转语音功能。

他指出,当前语音数据市场所面临的一大挑战在于,它高度依赖于诸如油管(YouTube)视频内容或难以抓取的Instagram内容等来源。施耐德的业务是为那些有意购买或出售数据集的公司牵线搭桥,他透露自己观察到许多公司寻求获取更多对话数据,例如客户服务电话记录,但这些公司不愿意出售此类敏感信息。

施耐德解释说:"要想拥有一个庞大的自然语言对话数据语料库,实属不易。”对于OpenAI表示不会使用通话数据进行训练,他并未感到太过意外,原因是围绕模型训练数据的审查越来越严格。

他说:“对于OpenAI而言,尽其所能证明这种假设不成立,可能比仅仅基于可能只是一小部分语音数据进行训练更有价值。”(财富中文网)

译者:中慧言-王芳

OpenAI表示,它不会利用通过其新推出的ChatGPT电话服务收集到的消费者声音数据来训练相关技术。

OpenAI的一位发言人告诉《财富》杂志,OpenAI并未利用1-800-ChatGPT服务的“通话、通话记录和WhatsApp消息”进行训练。这是一项于周三推出的复古式服务,消费者可以通过拨打指定的电话号码,以电话交流的方式与聊天机器人互动,进而访问这款备受欢迎的生成式人工智能应用程序。

许多观察人士认为,这项服务的推出至少在一定程度上是为了帮助OpenAI收集大量的语音数据,这些数据涵盖拥有不同口音、语音模式的人们,以及多样化的背景噪音。对于OpenAI、谷歌(Google)、Meta和苹果(Apple)等致力于开发新型“多模态”人工智能服务的公司而言,语音识别质量是一项重要特征。而提供免费电话服务以收集语音数据,则是谷歌首创的一项屡试不爽的硅谷技术。

谷歌于2007年推出了谷歌语音本地搜索服务(GOOG-411)。美国和加拿大用户可以通过拨打免费电话,获取镇上某家特定企业的地址、联系方式及营业时间等信息,或是“礼品店”或“牛排馆”等类别的商店或餐馆列表。

这项谷歌提供的工具服务是免费的,不像当时的电话公司对411服务收取一美元以上的费用。不过,GOOG-411的来电者提供的是他们的语音数据。谷歌利用来电者的语音数据建立了一个音素数据库,以改进其语音识别技术,该技术后来被整合到安卓手机软件等产品中。

现在就拨打电话!电话:1-800-ChatGPT

市值高达1570亿美元的OpenAI周三推出了ChatGPT电话服务,这是其所谓的为期12天的“ship-mas”活动的一部分。在此期间,该公司每天都会推出一款新产品或一项新功能。该系列活动的其他亮点还包括向所有用户开放Sora视频工具。

OpenAI首席产品官凯文·威尔(Kevin Weil)称,这项新推出的电话服务旨在让ChatGPT技术惠及更广泛的公众。威尔周三在直播中说:“我们的目标之一是让这项技术尽可能地普及。”

从周三开始,美国用户能够通过拨打1-800-CHATGPT咨询聊天机器人。全球其他地区的用户则可通过WhatsApp拨打此号码享受同样服务。OpenAI表示,所有拨打该热线的用户均可享受每月15分钟的免费通话时长。

在接通电话时,聊天机器人会以这样的问候语开场:“您好,我是人工智能助手ChatGPT。为了安全起见,我们的通话可能会被审查。选择继续通话即表示您同意OpenAI的条款和隐私政策。那么,请问有什么可以帮助您的吗?”

根据上述隐私政策,OpenAI根据用户和研究人员提供的信息、第三方合作伙伴数据和公开的互联网内容来训练其基础模型。因此,尽管该公司未来可能会调整策略,利用通话数据来训练其人工智能技术,但OpenAI发言人表示,该公司目前还没有开始使用通话数据进行训练的计划。

Nomad Data首席执行官布拉德·施耐德(Brad Schneider)在接受《财富》杂志采访时表示,1-800-ChatGPT是一种极具“智慧”的手段,能够促使用户使用语音功能,进而构建其语音转语音功能。

他指出,当前语音数据市场所面临的一大挑战在于,它高度依赖于诸如油管(YouTube)视频内容或难以抓取的Instagram内容等来源。施耐德的业务是为那些有意购买或出售数据集的公司牵线搭桥,他透露自己观察到许多公司寻求获取更多对话数据,例如客户服务电话记录,但这些公司不愿意出售此类敏感信息。

施耐德解释说:"要想拥有一个庞大的自然语言对话数据语料库,实属不易。”对于OpenAI表示不会使用通话数据进行训练,他并未感到太过意外,原因是围绕模型训练数据的审查越来越严格。

他说:“对于OpenAI而言,尽其所能证明这种假设不成立,可能比仅仅基于可能只是一小部分语音数据进行训练更有价值。”(财富中文网)

译者:中慧言-王芳

OpenAI says it will not train its technology on the voices of consumers who use its new ChatGPT telephone service.

A company spokesperson told Fortune that OpenAI was not training on “calls, transcripts of calls, and WhatsApp messages” placed to 1-800-ChatGPT, a retro-style service unveiled on Wednesday that allows consumers to access the popular generative AI application by dialing the phone number and speaking to the chatbot through a phone call.

Many observers had assumed the service was—at least in part—intended to help OpenAI collect scads of voice data from people with various accents and speech patterns, as well as background noises. Voice recognition quality is an important feature for companies developing new “multimodal” AI services such as OpenAI, Google, Meta, and Apple. And offering a free phone service to collect voice data is a tried-and-true Silicon Valley technique pioneered by Google.

Google launched Google Voice Local Search, or GOOG-411, in 2007. Users in the U.S. and Canada could call a toll-free number for information like the address, contact information, and hours of a particular business in town, or a list of shops or restaurants that fit a category such as “gift shops” or “steak houses.”

The Google tool was free, unlike the dollar-plus phone companies charged on 411 services at the time. GOOG-411 callers were offering up their voice data instead. Google used the voice data from callers to build a phoneme database to improve its speech-recognition technology, which it has since incorporated into products like its Android mobile software.

Call now! That’s 1-800-ChatGPT

OpenAI, which is valued at $157 billion, unveiled the ChatGPT phone service Wednesday as part of its so-called 12 days of ship-mas, during which the company has launched a new product or feature each day. Other highlights from the series include making the Sora video tool generally available.

OpenAI chief product officer Kevin Weil described the new phone service as a way to make ChatGPT technology more accessible to a broader swath of the public. “Part of that is making it as accessible as possible to as many people as we can,” Weil said on a livestream Wednesday.

As of Wednesday, U.S. users can call 1-800-CHATGPT to query the chatbot. Other global users can WhatsApp the number. OpenAI says those who call in will get 15 free minutes per month.

When called, the chatbot’s greeting goes: “Hi, I’m ChatGPT, an AI assistant. Our conversation may be reviewed for safety. By continuing this call, you agree to OpenAI’s terms and privacy policy. So, how can I help you?”

Per the privacy policy in question, OpenAI trains its foundational models on information provided by users and researchers, on top of third-party partner data and publicly available internet content. So while the company could change course and train its AI tech with the call data in the future, the OpenAI spokesperson said the company does not currently have plans to start using call data.

Brad Schneider, CEO of Nomad Data, told Fortune that 1-800-ChatGPT would be a “smart” way to get users to use the voice features and, in turn, build out its speech-to-speech capabilities.

The challenge with the existing marketplace of voice data is that it largely relies on content from YouTube videos or tougher-to-scrape Instagram content, he said. Schneider, whose business connects companies looking to buy and sell their dataset, said he sees many requests for more conversational data, like customer service calls, but companies are reluctant to sell that sort of sensitive information.

“It’s hard to have a huge corpus of natural-language conversation data,” Schneider explained. Though he’s not entirely surprised that OpenAI says it’s not using the call data, citing growing scrutiny around model training.

“It’s probably more valuable for OpenAI to do everything they can to disprove this than it is to train on what will likely be a small set of voice data,” he said.

财富中文网所刊载内容之知识产权为财富媒体知识产权有限公司及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
0条Plus
精彩评论
评论

撰写或查看更多评论

请打开财富Plus APP

前往打开