-

What would a Provably Safe AGI Framework look like?
-
AN #102 通过 GPT-3 的元学习和人工智能对齐的完全提议列表
-
AN #103 ARCHES:存在性安全的议程和组合自然语言的深度强化学习
-
机器学习理论之狂欢 COLT2020
-
AN #104 无法访问的信息带来的危险,以及我们可以从 COVID 了解到的有关人工智能对齐的经验
-
AN #100 智能体在执行时学习奖励函数 可能会出问题
-
AN #106 评价学到的奖励模型的泛化能力
-
AN #105 人类的经济轨迹和优化可能的“真正”含义
-
Comments|Quantifying Differences in Reward Functions
-
Logician|Boris Trakhtenbrot
-
第 98 期对齐周报 通过查看哪些梯度有用来了解神经网络训练