[Funland] Chào mừng DeepSeek R1!

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
13,783
Động cơ
342,279 Mã lực
Nếu Nvidia nhúng 1 đoạn lệnh vào trong card của họ để gửi report về máy chủ thì có thể biết được, nếu không thì khó đấy cụ.
Nhúng mã bí mật là vi phạm khủng, tàn đời Nvidia nhé. Còn card thì cần gì đi mua khi Mỹ cho thuê máy để chạy đầy, không nhất thiết phải mang card về TQ mới chạy được.
 

Lá me xanh

Xe buýt
Biển số
OF-722540
Ngày cấp bằng
28/3/20
Số km
783
Động cơ
113,602 Mã lực
Tuổi
36
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
 

Haiau69

Xe tăng
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
1,022
Động cơ
183,340 Mã lực
Nơi ở
Hà Nội
Chắc chắn là các nội dung được coi là nguy hại bị lọc rồi ợ. Không chỉ 18+ mà còn nhiều thứ khác nữa.

Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
 

huyen141292

Xe điện
Biển số
OF-746730
Ngày cấp bằng
18/10/20
Số km
2,308
Động cơ
127,646 Mã lực
Tuổi
32
Em đã từng hỏi " ai là tác giả bài Chiêu hồn tử sĩ" và Chat GPT trả lời có 2 bài của 2 tác giả. Tức các AI phải thuê đội ngũ đủ các lĩnh vực thơ ca nhạc họa lịch sử ở từng quốc gia để dạy AI. Do đó chi phí phát triển cao ngất ngưỡng.
Còn DeepSeek làm kiểu trộn bê tông nên không tách nổi xi măng cát sỏi nữa. Tức DeepSeek trộn nhiều AI của thiên hạ thành mớ hổ lốn của mình nên giá thành rất rẻ. Cái giỏi của DeepSeek là họ trộn xong thì không ai truy ra bản gốc nữa, giới chuyên môn gọi đây là phương pháp sàng sảy hay rây bột gì đó
Túm váy lại: vì không nghĩ có kiểu chơi bẩn như vậy nên các hãng chưa kịp chống. Chắc chắn sau này họ sẽ gài bẫy bóc trần kiểu khôn lỏi như vậy và DeepSeek sẽ bị cấm
 

Haiau69

Xe tăng
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
1,022
Động cơ
183,340 Mã lực
Nơi ở
Hà Nội
Nó đọc nội dung cụ đưa vào nó hiểu là 18+ thế là nó không ngu lắm 😀
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
 

losedow

Xe buýt
Biển số
OF-822088
Ngày cấp bằng
6/11/22
Số km
793
Động cơ
796,159 Mã lực
Em đã từng hỏi " ai là tác giả bài Chiêu hồn tử sĩ" và Chat GPT trả lời có 2 bài của 2 tác giả. Tức các AI phải thuê đội ngũ đủ các lĩnh vực thơ ca nhạc họa lịch sử ở từng quốc gia để dạy AI. Do đó chi phí phát triển cao ngất ngưỡng.
Còn DeepSeek làm kiểu trộn bê tông nên không tách nổi xi măng cát sỏi nữa. Tức DeepSeek trộn nhiều AI của thiên hạ thành mớ hổ lốn của mình nên giá thành rất rẻ. Cái giỏi của DeepSeek là họ trộn xong thì không ai truy ra bản gốc nữa, giới chuyên môn gọi đây là phương pháp sàng sảy hay rây bột gì đó
Túm váy lại: vì không nghĩ có kiểu chơi bẩn như vậy nên các hãng chưa kịp chống. Chắc chắn sau này họ sẽ gài bẫy bóc trần kiểu khôn lỏi như vậy và DeepSeek sẽ bị cấm
Tại sao cụ lại hỏi ai về ai là ai của ai?, thay vì lên gg cho nhanh?
AI (ai) nó không phải bộ tìm kiếm. Nó là nhân cách giả lập, thế thôi mà.
 

viet7500

Xe buýt
Biển số
OF-367244
Ngày cấp bằng
18/5/15
Số km
923
Động cơ
257,859 Mã lực
Bài viết nội dung nhạy cảm về chính trị, văn hoá, xã hội
Cấm viết bài trong thớt
 
Chỉnh sửa bởi quản trị viên:

Lá me xanh

Xe buýt
Biển số
OF-722540
Ngày cấp bằng
28/3/20
Số km
783
Động cơ
113,602 Mã lực
Tuổi
36

Bài viết nội dung nhạy cảm về chính trị, văn hoá, xã hội
Cấm viết bài trong thớt
 
Chỉnh sửa bởi quản trị viên:

Haiau69

Xe tăng
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
1,022
Động cơ
183,340 Mã lực
Nơi ở
Hà Nội
Gần đây em có xem 1 bộ phim viễn tưởng tên là Ex Machina về AI khá hay. 1 em người máy có AI ở cấp độ cao lừa tình 1 anh lập trình viên có nhiệm vụ kiểm nghiệm xem nó có giống người thật không và làm cho anh này có tình cảm với nó thật. Sau đó em người máy này giết tay đã tạo ra nó và trốn ra ngoài.

Các cụ xem phim này rồi nghĩ thêm câu hỏi cho Deepseek sẽ thú vị hơn đấy. Hỏi nó về kiến thức thì em chả thấy có gì là hay cả, cơ bản là học thuộc lòng chứ có gì đâu.
 

BMZ_Z4

Xe điện
Biển số
OF-83
Ngày cấp bằng
31/5/06
Số km
2,712
Động cơ
1,177,354 Mã lực
Dạ

Giao tiếp theo kiểu hỏi hôm nay là ngày gì thì tôi lại sợ là nó học sẽ bị ngu đi theo thầy dạy ạ
Nếu ngu đi thì họ thay đổi cách nó hoạt động chứ cụ
Nếu nó nói đúng có khi chả thay đổi được gì và chính khi đó training lại chẳng có tác dụng.
 

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,629
Động cơ
317,935 Mã lực
Tuổi
40
Alibaba cũng cay lắm, đường ông lớn bỏ cả đống tiền mà ko nổi bằng thằng vô danh
Team Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.
Con Deepseek R1 thì tải về máy chạy offline thì cần phải 16 con chip A100 mới đủ tải 1 người dùng (~50 tps). Một hệ thống như vậy giá trên 6 tỷ đồng đầu tư và vài triệu đồng tiền điện mỗi ngày mà chỉ phục vụ được 1 người dùng. Với hệ thống rẻ tiền (60-70 triệu đồng) thì chỉ chạy được bản rút gọn bé tí, kết quả đầu ra sánh ngang rác, không sử dụng được. Như vậy tính kinh tế, hiệu quả hoặc khả năng triển khai cho người dùng cá nhân, doanh nghiệp nhỏ là không khả thi như thông tin sai trên truyền thông mấy ngày nay.
Giá Deepseek R1 API trên OR đang là $8 so sánh với giá $15 của mô hình Claude 3.5 Sonnet (đang được đánh giá nhỉnh hơn trong tác vụ có thị trường lớn nhất là code) là một mức giá tốt nhưng không cách mạng. Con thực sự rẻ tiền là con Deepseek v3 thì hiệu năng cũng không quá vượt trội, chỉ nhỉnh hơn con Qwen 2.5 Coder một chút.
Như vậy truyền thông đang nhập nhằng gắn 2 thằng vào 1. Họ cố ý gắn cả ưu điểm giá rẻ của Deepseek v3 và ưu điểm hiệu năng cao của Deepseek R1 vào để tạo ra ảo giác là có một thứ mang đầy đủ đặc điểm "ngon, bổ, rẻ".

Hiện nay về AI của TQ thì team Alibaba (Qwen) và Bytedance (Doubao) là 2 team mạnh có thể đấu các team Mỹ. Các team khác (kể cả team Deepseek, theo em nghĩ) chưa đáng kể. Cái hay và đột phá của Deepseek là họ open model để mọi người tải về. Đây là nước đi rất hay để gây chú ý và gọi vốn. Bởi nếu không có thêm vốn để đua phần cứng thì hệ thống của họ sẽ sớm bị vỡ (như đã thấy hôm nay). Đây là nước đi "đập nồi dìm thuyền" vì các tay to hoặc sẽ bơm tiền đầu tư cho họ, hoặc sẽ bơm tiền để kéo người đi xé nát team.
 

songoku2204

Xe buýt
Biển số
OF-825258
Ngày cấp bằng
17/1/23
Số km
966
Động cơ
630,328 Mã lực
Nơi ở
Bắc Kạn
https://genk.vn/openai-tuyen-bo-tim-thay-bang-chung-cho-thay-deepseek-dung-mo-hinh-cua-ho-de-dao-tao-ai-20250130152705297.chn Như này thì sớm muộn sẽ có 1 AI siêu thông minh, chả cần phần cứng cao cấp hay thư viện khổng lồ, chỉ cần điều khiển hoặc sử dụng dữ liệu của các AI khác theo ý của mình giống kiểu mô hình người tí hon trên đầu kẻ khổng lồ vậy. Tất nhiên nó sẽ thừa thông minh để lách luật về bản quyền, pháp lý.
 

thaibom

Xe tăng
Biển số
OF-365335
Ngày cấp bằng
4/5/15
Số km
1,154
Động cơ
12,921 Mã lực
Em chưa thử, nhưng thấy mọi người khen nhiều, nghỉ tết xong test thử xem có gì hay ho không
 

congthuong

Xe điện
Biển số
OF-387066
Ngày cấp bằng
14/10/15
Số km
2,885
Động cơ
284,388 Mã lực
Nghe nói Mẽo nó đang điều tra TQ gom tầm 3 tỏi $ mua H100 từ các bên thứ 3, để ngầm làm con DS này dù TQ tuyên bố chỉ dùng H800 theo đúng lệnh hạn chế.
E ngoại đạo ko biết Nvidia có thể kiểm soát lượng chip của mình đi đâu về đâu ko?
Nếu TQ thuê hệ thống của FPT thì Mẽo kiểm soát kiểu gì nhỉ ?

Đâu cần phải mua trực tiếp từ Nvidia đâu.
 

congthuong

Xe điện
Biển số
OF-387066
Ngày cấp bằng
14/10/15
Số km
2,885
Động cơ
284,388 Mã lực
https://genk.vn/openai-tuyen-bo-tim-thay-bang-chung-cho-thay-deepseek-dung-mo-hinh-cua-ho-de-dao-tao-ai-20250130152705297.chn Như này thì sớm muộn sẽ có 1 AI siêu thông minh, chả cần phần cứng cao cấp hay thư viện khổng lồ, chỉ cần điều khiển hoặc sử dụng dữ liệu của các AI khác theo ý của mình giống kiểu mô hình người tí hon trên đầu kẻ khổng lồ vậy. Tất nhiên nó sẽ thừa thông minh để lách luật về bản quyền, pháp lý.
Nếu vậy thì nó sẽ không giỏi hơn các AI khác được.

Deepseek chỉ là 1 bản sao của ChatGPT có thêm bộ lọc thôi. Tương lai sẽ không thể vượt qua ChatGPT được.
 

blacknumbers

Xe tải
Biển số
OF-573653
Ngày cấp bằng
12/6/18
Số km
496
Động cơ
73,516 Mã lực
Nhúng mã bí mật là vi phạm khủng, tàn đời Nvidia nhé. Còn card thì cần gì đi mua khi Mỹ cho thuê máy để chạy đầy, không nhất thiết phải mang card về TQ mới chạy được.
Hị, hị.... Nhưng đám mây không nằm ở nhà mình thì bao nhiêu tài nguyên đem gom góp cho cọp nó xơi mất rầu!
 

DIT

Xe điện
Biển số
OF-600754
Ngày cấp bằng
25/11/18
Số km
2,367
Động cơ
190,421 Mã lực
Tuổi
39
Team Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.
Con Deepseek R1 thì tải về máy chạy offline thì cần phải 16 con chip A100 mới đủ tải 1 người dùng (~50 tps). Một hệ thống như vậy giá trên 6 tỷ đồng đầu tư và vài triệu đồng tiền điện mỗi ngày mà chỉ phục vụ được 1 người dùng. Với hệ thống rẻ tiền (60-70 triệu đồng) thì chỉ chạy được bản rút gọn bé tí, kết quả đầu ra sánh ngang rác, không sử dụng được. Như vậy tính kinh tế, hiệu quả hoặc khả năng triển khai cho người dùng cá nhân, doanh nghiệp nhỏ là không khả thi như thông tin sai trên truyền thông mấy ngày nay.
Giá Deepseek R1 API trên OR đang là $8 so sánh với giá $15 của mô hình Claude 3.5 Sonnet (đang được đánh giá nhỉnh hơn trong tác vụ có thị trường lớn nhất là code) là một mức giá tốt nhưng không cách mạng. Con thực sự rẻ tiền là con Deepseek v3 thì hiệu năng cũng không quá vượt trội, chỉ nhỉnh hơn con Qwen 2.5 Coder một chút.
Như vậy truyền thông đang nhập nhằng gắn 2 thằng vào 1. Họ cố ý gắn cả ưu điểm giá rẻ của Deepseek v3 và ưu điểm hiệu năng cao của Deepseek R1 vào để tạo ra ảo giác là có một thứ mang đầy đủ đặc điểm "ngon, bổ, rẻ".

Hiện nay về AI của TQ thì team Alibaba (Qwen) và Bytedance (Doubao) là 2 team mạnh có thể đấu các team Mỹ. Các team khác (kể cả team Deepseek, theo em nghĩ) chưa đáng kể. Cái hay và đột phá của Deepseek là họ open model để mọi người tải về. Đây là nước đi rất hay để gây chú ý và gọi vốn. Bởi nếu không có thêm vốn để đua phần cứng thì hệ thống của họ sẽ sớm bị vỡ (như đã thấy hôm nay). Đây là nước đi "đập nồi dìm thuyền" vì các tay to hoặc sẽ bơm tiền đầu tư cho họ, hoặc sẽ bơm tiền để kéo người đi xé nát team.
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
 
Chỉnh sửa cuối:

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,629
Động cơ
317,935 Mã lực
Tuổi
40
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
Em vẫn cho là bơm tin bẩn để gom hàng thôi. Em không vào được cổ Mỹ nhưng cũng sẵn tay nhận cược kèo nvda trong vòng 1 tháng tới hồi trên 135. Như em đã nói, con r1 tuy open nhưng chi phí triển khai cho doanh nghiệp nhỏ rất đắt đỏ và hiệu quả kinh tế không cao. Vì vậy chỉ có các tay chơi lớn như aws đủ nguồn lực triển khai và bán dịch vụ cloud cho khách có nhu cầu. Và như thế thì lại thành bình thường, sự đột phá rất hạn chế.
 
Thông tin thớt
Đang tải

Bài viết mới

Top