⚠️ AI安全不容忽视!RLHF让大模型更听话,但'奖励黑客'问题仍在。OpenAI超级对齐团队探索如何用弱AI监督强AI。当AI比人更聪明,如何确保它始终服务人类?这或许是21世纪最重要的技术挑战。#AI安全 #对齐 #AGI