

SELA
簡介 :
SELA是一個創新系統,它通過將蒙特卡洛樹搜索(MCTS)與基於大型語言模型(LLM)的代理結合起來,增強了自動化機器學習(AutoML)。傳統的AutoML方法經常產生低多樣性和次優的代碼,限制了它們在模型選擇和集成方面的有效性。SELA通過將管道配置表示為樹,使代理能夠智能地探索解決方案空間,並根據實驗反饋迭代改進其策略。
需求人群 :
SELA的目標受眾是機器學習研究人員和開發人員,特別是那些尋求通過自動化機器學習流程來提高模型選擇和集成效率的專業人士。SELA通過提供一種新穎的方法來探索和優化機器學習管道,適合需要處理大量數據和模型選擇的專業人員。
使用場景
使用SELA在泰坦尼克號數據集上進行模型選擇和集成。
利用SELA在房價預測任務中優化模型性能。
通過SELA進行消融研究,比較不同搜索策略對模型性能的影響。
產品特色
數據準備:支持從鏈接下載數據集或從頭開始準備數據集。
配置靈活:用戶可以根據需要修改數據配置和LLM配置。
SELA運行:提供了運行SELA的詳細步驟,包括設置、運行實驗和參數配置。
實驗模式:支持MCTS和隨機搜索(RS)兩種實驗模式。
參數調整:用戶可以根據需要調整諸如rollouts、timeout等參數。
斷點續跑:支持加載現有的MCTS樹,以便在實驗中斷後繼續。
Ablation Study:支持進行消融研究,比較不同搜索策略的效果。
使用教程
1. 數據準備:根據SELA的指南下載或準備數據集。
2. 配置設置:根據需要修改`datasets.yaml`和`data.yaml`文件中的配置。
3. 安裝依賴:在SELA目錄下運行`pip install -r requirements.txt`安裝所需依賴。
4. 運行SELA:使用`python run_experiment.py`命令並附加相應參數來運行實驗。
5. 參數調整:根據實驗需要調整rollouts、timeout等參數。
6. 結果分析:分析實驗結果,根據反饋迭代改進策略。
7. 斷點續跑:如果實驗中斷,可以使用`--load_tree`參數加載之前的MCTS樹繼續實驗。
精選AI產品推薦

Elicit
Elicit是一款能夠以超人速度分析研究論文的AI助手。它可以自動完成繁瑣的研究任務,如論文摘要、數據提取和綜合研究發現。用戶可以搜索相關論文、獲取一句話摘要、從論文中提取詳細信息並進行整理、尋找主題和概念等。Elicit的準確度高,使用方便,已受到廣大研究者的信賴和好評。
研究工具
625.7K
中文精選

Findin AI
Findin AI 是一款旨在通過人工智能技術全面提速學術研究工作流的工具。它通過文獻篩選、論文閱讀、筆記摘錄、主題研究、文獻綜述和學術寫作等功能,幫助用戶高效管理文獻和知識,提升研究效率。產品利用AI技術,如自動總結、一鍵獲取參考文獻、文獻問答等,大幅減少研究過程中的重複勞動,使研究者能夠專注於創新和深度思考。
研究工具
298.1K