[论文翻译]HuggingGPT: 用ChatGPT和Hugging Face上的模型解决AI任务
解决跨领域和多模态的复杂AI任务是实现通用人工智能的关键一步。虽然已有众多针对不同领域和模态的AI模型,但它们无法自主处理复杂AI任务。鉴于大语言模型(LLM)在语言理解、生成、交互和推理方面展现出卓越能力,我们提出可以让大语言模型作为控制器来管理现有AI模型,并以语言作为通用接口来实现这一目标。基于这一理念,我们推出了HuggingGPT——一个由大语言模型(如ChatGPT)驱动的AI智能体,通过连接机器学习社区(如Hugging Face)中的各类AI模型来解决AI任务。具体而言,当收到用户请求时,我们使用ChatGPT进行任务规划,根据Hugging Face上提供的功能描述选择相应模型,用选定模型执行每个子任务,并根据执行结果汇总响应。通过结合ChatGPT强大的语言能力和Hugging Face丰富的AI模型库,HuggingGPT能够处理涵盖不同模态和领域的复杂AI任务,在语言、视觉、语音等挑战性任务中取得显著成果,这为实现通用人工智能开辟了新途径。