口渴的人工智能训练ChatGPT需要

流行的大型语言模型(LLM),如OpenAI的ChatGPT和谷歌的Bard,是能源密集型的,需要大量的服务器场来提供足够的数据来训练强大的程序。为这些数据中心降温也会让人工智能聊天机器人非常口渴。

新的研究表明,仅GPT-3的训练就消耗了18.5万加仑(70万升)的水。根据这项新的研究,普通用户与ChatGPT的对话基本上相当于把一大瓶淡水倒在地上。鉴于聊天机器人前所未有的受欢迎程度,研究人员担心,所有这些溢出的瓶子都可能对供水造成令人不安的损失,尤其是在美国历史性的干旱和迫在眉睫的环境不确定性的情况下。

科罗拉多大学的研究人员在一篇题为“让人工智能减少‘口渴’”的论文中发表了人工智能用水量估计。作者发现,训练GPT-3所需的清澈淡水量相当于填充核反应堆冷却塔所需的水量。

OpenAI没有透露训练GPT-3所需的时间长度,这使研究人员的估计复杂化,但微软表示,其最新的超级计算机需要一个广泛的冷却设备,包含个图形卡和超过28.5万个处理器内核,让我们得以一窥人工智能背后的大规模操作。这么多加仑的水可以生产特斯拉的电池,或者换言之,继GPT-3之后的ChatGPT需要“喝”一个毫升的水瓶,才能完成与用户的基本交流,其中包括大约25-50个问题。

训练人工智能模型所需的大量加仑数也假设训练是在微软最先进的美国数据中心进行的,该数据中心专门为数千万的OpenAI而建。报告指出,如果数据在该公司能效较低的亚洲数据中心进行培训,耗水量可能会高出三倍。研究人员预计,随着最近发布的GPT-4等新模型的出现,这些水需求只会进一步增加,这些模型比以前的模型依赖更大的数据参数。

研究人员表示:“人工智能模型的水足迹不能再被忽视了。”。“作为应对全球水挑战的集体努力的一部分,必须优先解决水足迹问题。”

聊天机器人是如何用水的?

在计算人工智能的耗水量时,研究人员对水的“抽取”和“消耗”进行了区分。第一个例子是从河流、湖泊或其他水源中物理去除水的做法,而消耗专门指在数据中心使用时蒸发造成的水损失。对人工智能用水的研究主要集中在该方程的消耗部分,即水不能回收。

任何在公司服务器室呆过几秒钟的人都知道,服务器机房保持凉爽,通常在50到80华氏度之间,以防止设备出现故障。保持理想的温度是一个持续的挑战,因为服务器本身将电能转化为热量。像下面所示的冷却塔通常被用来抵消热量,并通过蒸发冷水将房间保持在理想温度。

数据中心过程中的蒸发冷却塔

冷却塔完成了这项工作,但需要大量的水才能完成。研究人员估计,在一个平均数据中心,每千瓦时消耗大约一加仑的水。也不是任何类型的水都可以使用。数据中心采用清洁的淡水资源,以避免海水带来的腐蚀或细菌生长。淡水对房间的湿度控制也是必不可少的。研究人员同样要求数据中心对产生大量电力所需的水负责,科学家称之为“场外间接用水”

耗水量问题不仅限于OpenAI或AI模型。年,谷歌仅在三个州就为数据中心申请了超过23亿加仑的水。该公司目前在北美有14个数据中心,用于支持谷歌搜索、其工作场所产品套件,以及最近的LaMDa和Bard大型语言模型。根据最近的研究论文,仅LaMDA一项就可能需要数百万升水来训练,比GPT-3还大,因为谷歌的几个口渴的数据中心都位于德克萨斯州等炎热的州;然而,研究人员对这一估计提出了警告,称其为“近似参考点”

除了水,新的LLM同样需要惊人的电量。斯坦福大学上周发布的一份人工智能报告考察了四个著名人工智能模型的能耗差异,估计OpenAI的GPT-3在训练期间释放了公吨碳。总的来说,训练GPT-3所需的能量可以为普通美国人的家庭供电数百年。

关键设施效率解决方案首席执行官KevinKent在接受采访时表示:“数据中心的竞争非常激烈。”。“他们不可能总是做出最环保的选择。”

气候变化和日益恶化的干旱可能会加剧人们对人工智能用水的担忧

据世界经济论坛估计,目前约有万美国居民缺乏水和基本的室内管道。另有万人生活在“不足”的供水系统中。研究人员担心,到本世纪末,气候变化和美国人口增加的结合将使这些数字变得更糟。斯坦福大学估计,到年,该国个淡水流域中近一半将无法满足每月的用水需求。据报道,在未来50年内,许多地区的供水量可能会减少三分之一。

部分由人类活动推动的气温上升导致美国西部出现了年来最严重的干旱,这也威胁到淡水,尽管最近的洪水帮助避免了一些可怕的担忧。到目前为止,米德湖等水库的水位已经下降,露出了几十年前的人类遗骸。所有这些都意味着人工智能的巨大用水需求可能会成为一个越来越激烈的争论点,尤其是如果这项技术被嵌入到越来越多的行业和服务中的话。LLM的数据需求越来越大,这意味着公司必须找到提高数据中心用水效率的方法。



转载请注明地址:http://www.1xbbk.net/jwbrc/7664.html


  • 上一篇文章:
  • 下一篇文章:
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7