Position: In-House Evaluation is Not Enough. Towards Robust Third-Party Evaluation and Flaw Disclosure for General-Purpose AI

Shayne Longpre, Kevin Klyman, Ruth Elisabeth Appel,Sayash Kapoor,Rishi Bommasani, Michelle Sahar,Sean McGregor,Avijit Ghosh, Borhane Blili-Hamelin, Nathan Butters,Alondra Nelson, Amit Elazari, Andrew Sellars, Casey Ellis, Dane Sherrets,Dawn Song, Harley Geiger, Ilona Cohen, Lauren McIlvenny, Madhulika Srikumar, Mark Jaycox,Markus Anderljung, Nadine Johnson,Nicholas Carlini, Nicolas Miailhe, Nik Marda,Peter Henderson, Rebecca Portnoff,Rebecca Weiss, Victoria Westerhoff,Yacine Jernite, Rumman Chowdhury,Percy Liang,Arvind Narayanan

ICML 2025（2025）

引用 0|浏览3

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要