DeepSeek: Improving Language Model Reasoning Capabilities Using Pure Reinforcement Learning

Retrieved on: 2025-01-27 18:30:57

Tags for this article:

Click the tags to see associated articles and topics

DeepSeek: Improving Language Model Reasoning Capabilities Using Pure Reinforcement Learning. View article details on hiswai:

Excerpt

A new technical paper titled “DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning” was published by DeepSeek.

Article found on: semiengineering.com