© 2026 Alpha Hinex. Powered by Hexo Theme Obsidian
「 AI 」 十二月 31, 2023
文章字数 7.1k 阅读约需 6 mins.
HumanEval 是 OpenAI 用来评估大语言模型生成代码能力的工具,包括手写的 164 个 python 编程问题及解答的 jsonl 格式数据,以及执行评估的脚本。
先来看下数据集,下面是 ...
先来看下数据集,下面是 HumanEval.jsonl.gz 中的一条数据:
{ "task_id": "HumanEval/0", "prompt": "from typing import List\n\n\ndef has_close_elements...