RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理

最新博文



友情链接

    我要啦免费统计