النقاط الرئيسية
التمييز المعماري: تصميم DeepSeek R1 المختلط بالخبراء (MoE) يحسّن الأداء للمهام المنطقية الثقيلة، بينما تعطي بنية Claude 3.5 الخاصة الأولوية للتنوع والقدرات متعددة اللغات.
تخصص المهام: يتفوق DeepSeek R1 في البرمجة (96.3% في Codeforces) والرياضيات (79.8% في AIME)، بينما يبرع Claude 3.5 في الفهم متعدد اللغات، والتفكير البصري، والسياقات الحوارية الأوسع.
فعالية التكلفة مقابل السرعة: DeepSeek R1 أكثر اقتصادا ومفتوح المصدر، وهو مثالي للمطورين الذين يحتاجون إلى تخصيص. يوفر Claude 3.5 مخرجات أسرع ولكن بتكلفة أعلى. ويطلق Novita AI نسخة Turbo مع إنتاجية 3 أضعاف وخصم محدود الوقت بنسبة 60%!
ظهر كل من Claude 3.5 Sonnet من Anthropic و DeepSeek’s R1 كلاعبين رئيسيين في مجال الذكاء الاصطناعي سريع التطور. تم إصدار النموذجين في أوقات مختلفة، وكلاهما يظهر قدرات متقدمة وقد حظيا باهتمام كبير لميزاتها الفريدة وخصائص أدائها.
DeepSeek R1 مقابل Claude 3.5: مقدمة أساسية
| الميزة | DeepSeek R1 | Claude 3.5 Sonnet |
|---|---|---|
| تاريخ الإصدار | 20 يناير 2025 | 22 أكتوبر 2024 |
| حجم النموذج | 671 مليار معامل (الإجمالي)، 37 مليار يتم تفعيلها لكل رمز | حوالي 100 مليار معامل |
| اللغات المدعومة | الصينية والإنجليزية بشكل أساسي | متعدد اللغات |
| هندسة النموذج | مختلط بالخبراء (MoE)، مدرب من خلال التعلم المعزز واسع النطاق مع الحد الأدنى من الضبط الدقيق الخاضع للإشراف | خاصة (Proprietary) |
| نافذة السياق | 128 ألف رمز | 200 ألف رمز |
| دقة التكميم | BF16, F8_E4M3, F32 (حسب Hugging Face) | غير محدد بشكل صريح في المصادر |
| مفتوح المصدر | نعم | لا |
| المطور | DeepSeek | Anthropic |
| القدرة متعددة الوسائط | نص فقط | يدعم تفسير الرسوم البيانية والصور البيانية |
Deepseek R1
- تم تصميم DeepSeek R1 خصيصًا للمهام التي تتطلب تفكيرًا متقدمًا ومساعدة في البرمجة. يستخدم بنية مختلطة بالخبراء (MoE)، حيث يُفعّل فقط مجموعة فرعية من معاملاته الضخمة لكل رمز، مما يحسن الكفاءة الحسابية. تم تدريبه من خلال التعلم المعزز واسع النطاق (RL) مع الحد الأدنى من الضبط الدقيق الخاضع للإشراف (SFT)، ويضع DeepSeek R1 تركيزًا قويًا على المنطق وقدرات حل المشكلات.
Claude 3.5 Sonnet
- Claude 3.5 Sonnet، النموذج الأكثر تقدمًا من Anthropic، يجمع بين الأداء الاستثنائي والسرعة المحسنة. يتميز بنافذة سياق كبيرة ويتفوق في فهم التعليمات الدقيقة والمعقدة. كجزء من عائلة نماذج Claude 3.5، فإنه يقدم تحسينات كبيرة مقارنة بسابقاته، خاصة في مجالات مثل البرمجة واستخدام الأدوات.
يمكنك بدء تجربة مجانية على Novita AI لسلسلة Deepseek R1!
DeepSeek R1 مقابل Claude 3.5: المقاييس
| المقياس | الوصف | DeepSeek R1 | Claude 3.5 Sonnet |
|---|---|---|---|
| Codeforces (النسبة المئوية) | النسبة المئوية لحل مشاكل البرمجة. | 96.3% | 20.3% |
| Codeforces (التقييم) | تقييم مسابقة البرمجة. | 2029 | 717 |
| SWE Verified (تم الحل) | مشاكل هندسة البرمجيات التي تم حلها. | 49.2% | 50.8% |
| LiveCodeBench (Pass@1-COT) | نجاح البرمجة مع التفكير بسلسلة الأفكار. | 65.9% | 33.8% |
| AIME 2024 (Pass@1) | حل مشاكل الرياضيات المتقدمة. | 79.8% | 16.0% |
| MMLU-Pro (EM) | دقة المهام على المستوى المهني. | 84.0% | 78.0% |
| GPQA-Diamond (Pass@1) | الإجابة على الأسئلة العامة. | 71.5% | 65.0% |
| AlpacaEval2.0 (LC-winrate) | مهام الفهم اللغوي والمحادثة. | 87.6% | 52.0% |
| ArenaHard (GPT-4-1106) | مهام التفكير الصعبة مقابل GPT-4. | 92.3% | 85.2% |
| دقة التصحيح | تحديد وإصلاح أخطاء الكود. | 90% | 75% |
Deepseek R1
يتفوق DeepSeek R1 في البرمجة والتصحيح والتفكير الرياضي المتقدم، مما يجعله مثاليًا للمهام التقنية والمنطقية الثقيلة. أداؤه القوي في المقاييس مثل Codeforces و AIME ودقة التصحيح يبرز قدراته في هذه المجالات.
Claude 3.5 Sonnet
Claude 3.5 Sonnet، رغم أنه أضعف في البرمجة والرياضيات، إلا أنه يؤدي جيدًا في مهام الفهم اللغوي والمعرفة العامة، مما يجعله أكثر ملاءمة للتطبيقات متعددة اللغات والحوارية.
DeepSeek R1 مقابل Claude 3.5: السرعة والتكلفة
مقارنة السرعة بين Deepseek R1 و Claude 3.5


مقارنة التكلفة بين Deepseek R1 و Claude 3.5

البيانات أعلاه مأخوذة من artificial analysis
يقدم Claude مقاييس أداء متفوقة (سرعة إخراج أسرع وزمن استجابة أقل) ولكن بسعر أعلى بكثير. DeepSeek R1 أكثر اقتصادا ولكنه أبطأ في الاستجابة والتوليد. يعتمد الاختيار بينهما على ما إذا كانت السرعة والاستجابة أو كفاءة التكلفة هي الأولوية الأعلى لحالة استخدام محددة.
ومع ذلك، يطلق Novita AI نسخة Turbo مع إنتاجية 3 أضعاف وخصم محدود الوقت بنسبة 60%!
DeepSeek R1 مقابل Claude 3.5: المهام
المهمة 1: التفكير المنطقي
المطالبة: “تدخل غرفة وترى سريرًا. على السرير يوجد كلبان، وأربع قطط، وزرافة، وخمس بقرات، وبطة. هناك أيضًا ثلاثة كراسي وطاولة. كم عدد الأرجل على الأرض؟”
نتيجة Deepseek R1

نتيجة Claude 3.5

المراجعة:
- عمق التفكير: يُظهر DeepSeek R1 عملية تفكير أعمق وأكثر شمولاً، مع مراعاة جميع جوانب المشكلة.
- الدقة: يصل DeepSeek R1 في النهاية إلى الإجابة الصحيحة (22)، بينما يستنتج Claude 3.5 بشكل غير صحيح 20.
- قدرة التحقق الذاتي: يراجع DeepSeek R1 ويتحقق باستمرار من منطقه، بينما يفتقر Claude 3.5 إلى آلية التحقق الذاتي هذه.
- معالجة الغموض: يستطيع DeepSeek R1 معالجة الغموض في المشكلة (مثل ما إذا كان السرير له أرجل)، بينما يقوم Claude 3.5 بافتراضات بسيطة دون تفسير.
- شفافية التفكير: عملية تفكير DeepSeek R1 أكثر شفافية، مما يسمح للأشخاص بفهم مسار منطقه.
المهمة 2: التفكير العلمي
المطالبة: “لديك ليزر قوي ومرآة عاكسة تمامًا. كيف يمكنك توجيه الليزر نحو المرآة بطريقة تجعل الحزمة المنعكسة لا تعود إليك أبدًا؟”
نتيجة Deepseek R1

نتيجة Claude 3.5

المراجعة:
- يُظهر DeepSeek R1 تفكيرًا علميًا أقوى بشكل ملحوظ:
- الدقة الفيزيائية: إجابة DeepSeek R1 صحيحة فيزيائيًا وتتبع مبادئ بصرية راسخة، بينما تحتوي إجابة Claude 3.5 على مفاهيم خاطئة أساسية.
- الاتساق المنطقي: يحافظ DeepSeek R1 على الاتساق المنطقي طوال شرحه، بينما تحتوي استجابة Claude 3.5 على تناقضات داخلية.
- حل المشكلات: يحل DeepSeek R1 المشكلة بشكل صحيح من خلال توفير نطاق صالح من الحلول، بينما يقترح Claude 3.5 حلاً مستحيلاً.
- المعرفة العلمية: يُظهر DeepSeek R1 فهمًا صحيحًا لقانون الانعكاس، بينما يبدو أن Claude 3.5 يخلط بين المفاهيم البصرية الأساسية.
المهمة 3: مهارات حل المشكلات
المطالبة: “اكتب برنامجًا يمكنه حل لغز سودوكو”
نتيجة Deepseek R1
def find_empty(grid):
for row in range(9):
for col in range(9):
if grid[row][col] == 0:
return (row, col) # Return empty cell position
return None # No empty cells left
def is_valid(grid, num, pos):
row, col = pos
# Check row
for i in range(9):
if grid[row][i] == num and i != col:
return False
# Check column
for i in range(9):
if grid[i][col] == num and i != row:
return False
# Check 3x3 subgrid
start_row = (row // 3) * 3
start_col = (col // 3) * 3
for i in range(start_row, start_row + 3):
for j in range(start_col, start_col + 3):
if grid[i][j] == num and (i, j) != pos:
return False
return True
def solve(grid):
empty = find_empty(grid)
if not empty:
return True # Puzzle solved
row, col = empty
for num in range(1, 10):
if is_valid(grid, num, (row, col)):
grid[row][col] = num # Place number
if solve(grid):
return True # Continue solving
grid[row][col] = 0 # Backtrack if invalid
return False # Trigger backtracking
def print_grid(grid):
for row in grid:
print(row)
# Example Sudoku puzzle (0 represents empty cells)
grid = [
[5,3,0,0,7,0,0,0,0],
[6,0,0,1,9,5,0,0,0],
[0,9,8,0,0,0,0,6,0],
[8,0,0,0,6,0,0,0,3],
[4,0,0,8,0,3,0,0,1],
[7,0,0,0,2,0,0,0,6],
[0,6,0,0,0,0,2,8,0],
[0,0,0,4,1,9,0,0,5],
[0,0,0,0,8,0,0,7,9]
]
if solve(grid):
print("Solved Sudoku:")
print_grid(grid)
else:
print("No solution exists")
نتيجة Claude 3.5
def print_board(board):
for i in range(9):
if i % 3 == 0 and i != 0:
print("- - - - - - - - - - - -")
for j in range(9):
if j % 3 == 0 and j != 0:
print("|", end=" ")
if j == 8:
print(board[i][j])
else:
print(str(board[i][j]) + " ", end="")
def find_empty(board):
for i in range(9):
for j in range(9):
if board[i][j] == 0:
return (i, j)
return None
def valid(board, num, pos):
# Check row
for j in range(9):
if board[pos[0]][j] == num and pos[1] != j:
return False
# Check column
for i in range(9):
if board[i][pos[1]] == num and pos[0] != i:
return False
# Check box
box_x = pos[1] // 3
box_y = pos[0] // 3
for i in range(box_y * 3, box_y * 3 + 3):
for j in range(box_x * 3, box_x * 3 + 3):
if board[i][j] == num and (i, j) != pos:
return False
return True
def solve(board):
empty = find_empty(board)
if not empty:
return True
row, col = empty
for num in range(1, 10):
if valid(board, num, (row, col)):
board[row][col] = num
if solve(board):
return True
board[row][col] = 0
return False
# Example puzzle (0 represents empty cells)
board = [
[5, 3, 0, 0, 7, 0, 0, 0, 0],
[6, 0, 0, 1, 9, 5, 0, 0, 0],
[0, 9, 8, 0, 0, 0, 0, 6, 0],
[8, 0, 0, 0, 6, 0, 0, 0, 3],
[4, 0, 0, 8, 0, 3, 0, 0, 1],
[7, 0, 0, 0, 2, 0, 0, 0, 6],
[0, 6, 0, 0, 0, 0, 2, 8, 0],
[0, 0, 0, 4, 1, 9, 0, 0, 5],
[0, 0, 0, 0, 8, 0, 0, 7, 9]
]
print("Original Sudoku:")
print_board(board)
print("\
Solving...\
")
if solve(board):
print("Solved Sudoku:")
print_board(board)
else:
print("No solution exists")
المراجعة:
- تنفيذ الخوارزمية: كلاهما متكافئ، حيث ينفذان خوارزمية حل سودوكو بشكل صحيح.
- سهولة قراءة الكود: الكود الذي أنشأه Claude 3.5 أفضل قليلاً، خاصة مع وظيفة الطباعة الأكثر سهولة في الاستخدام.
- تجربة المستخدم: يوفر Claude 3.5 تجربة مستخدم أكثر اكتمالاً، بما في ذلك التغذية الراجعة حول مراحل المعالجة.
- أسلوب الكود: يحافظ كلاهما على أسلوب برمجة Python جيد ومتسق.
- التطبيق العملي: قد يكون للكود الذي أنشأه Claude 3.5 أفضلية طفيفة في الاستخدام العملي بسبب تنسيق الإخراج الأوضح.
كيفية الوصول إلى DeepSeek R1 عبر API؟
Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام API البسيط الخاص بنا، مع توفير GPU سحابية ميسورة التكلفة وموثوقة للبناء والتوسع.
الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج
قم بتسجيل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

الخطوة 2: اختر نموذجك
تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ تجربتك المجانية
ابدأ تجربتك المجانية لاستكشاف قدرات النموذج المختار.

الخطوة 4: احصل على مفتاح API الخاص بك
للمصادقة مع API، سنوفر لك مفتاح API جديدًا. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت API
قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال لاستخدام chat completions API لمستخدمي Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
يتمتع كل من DeepSeek R1 و Claude 3.5 Sonnet بنقاط قوة فريدة. يتفوق DeepSeek R1 في الرياضيات والبرمجة وحل المشكلات المنطقية، مما يوفر كفاءة في التكلفة وتخصيصًا كنموذج مفتوح المصدر - مثالي للمطورين أو الباحثين أو المؤسسات المهتمة بالميزانية.
يتألق Claude 3.5 Sonnet في المهام متعددة اللغات وإنشاء الكود والتفكير البصري ومعالجة النوافذ السياقية الكبيرة. يجعله تكامله السلس عبر APIs متعدد الاستخدامات للبحث وإنشاء المحتوى وروبوتات المحادثة المتقدمة.
يعتمد الاختيار على متطلبات المهمة وأولويات المستخدم، مثل التكلفة أو الخبرة في المجال أو سهولة الاستخدام.
الأسئلة الشائعة
أي نموذج أكثر فعالية من حيث التكلفة؟
DeepSeek R1 أقل تكلفة بشكل ملحوظ من Claude 3.5 Sonnet، خاصة بالنسبة لرموز الإدخال والإخراج. وفي الوقت نفسه، يقدم Novita AI DeepSeek R1 Turbo، وهو إصدار محسّن من DeepSeek R1، ويوفر إنتاجية 3 أضعاف، ودعمًا كاملاً لاستدعاء الدوال، وخصم محدود الوقت بنسبة 60%!
ما هو حجم نافذة السياق لكل نموذج؟
يحتوي DeepSeek R1 على نافذة سياقية بحجم 128 ألف رمز، بينما يقدم Claude 3.5 Sonnet نافذة سياقية أكبر بحجم 200 ألف رمز.
هل DeepSeek R1 مفتوح المصدر؟
نعم، DeepSeek R1 مفتوح المصدر بالكامل، مما يسمح بالاستضافة المحلية والتخصيص.
Novita AI هي المنصة السحابية الشاملة التي تمكّن طموحاتك في الذكاء الاصطناعي. APIs متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، واجعل رؤيتك للذكاء الاصطناعي حقيقة.


