ARC-AGI:人工智慧通用推理測試集

連結:https://github.com/fchollet/ARC-AGI

ARC-AGI是一個旨在測試人工智慧系統是否具備類似人類一般流體智力的抽象和推理能力的資料集。它由400個訓練任務和400個評估任務組成,每個任務都以JSON格式儲存,包括輸入輸出對。該資料集可以作為人工智慧基準測試、程式合成基準測試或心理測量智力測試。

需求人群:

  • 目標受眾主要是人工智慧研究者和開發者,以及對人類智力和人工智慧智力測試感興趣的學者。該產品可以幫助他們評估和改進演演算法的泛化能力和推理能力。

使用場景示例:

  • 研究者使用ARC-AGI資料集訓練深度學習模型,以提高其解決抽象問題的能力。
  • 教育工作者利用該資料集作為教學工具,幫助學生理解人工智慧的工作原理。
  • 科技公司使用ARC-AGI作為基準測試,評估其AI產品的效能。

產品特色:

  • 提供抽象和推理任務資料集,用於訓練和評估人工智慧演演算法。
  • 包含瀏覽器介面,允許人類手動解決任務,測試人類智力。
  • 任務以JSON格式儲存,包括訓練和測試輸入輸出對。
  • 支援3次嘗試來構造輸出網格,以匹配測試輸入網格。
  • 使用顏色(0-9的整數)來視覺化網格中的單元格。
  • 提供測試介面,方便使用者載入任務並嘗試解決。

使用教學:

訪問ARC-AGI的GitHub頁面並下載資料集。

選擇一個任務JSON檔案,瞭解其訓練和測試輸入輸出對。

使用瀏覽器打開測試介面,並載入選定的任務。

在測試空間中,觀察示範的輸入輸出對,理解任務性質。

使用網格控制工具調整輸出網格大小,複製輸入網格或重置網格。

使用符號控制工具編輯網格單元格的顏色,選擇顏色並填充。

構造輸出網格後,點選「提交」按鈕驗證答案。

完成當前測試後,使用「下一個測試輸入」按鈕繼續或「載入任務」按鈕開始新任務。

返回頂端