Vào cuối năm 2021, trong trận đấu bóng đá giữa đội tuyển Việt Nam và Saudi Arabia, cũng như tại AFF Cup, các kênh YouTube trực tiếp bóng đá (như Next Sports) đã phải
tắt tiếng (mute) hoàn toàn bài Quốc ca Việt Nam vì sợ bị "đánh gậy" bản quyền hoặc mất doanh thu.
Tại sao Quốc ca - tài sản của Quốc gia - lại bị cá nhân/tổ chức đánh bản quyền? Đây là lỗ hổng sự giao thoa giữa
Luật Sở hữu trí tuệ và
Thuật toán Content ID.
1. Bản chất pháp lý của âm nhạc: 2 loại quyền tách biệt
Để hiểu thuật toán sai ở đâu, bạn phải hiểu nhạc có 2 quyền riêng biệt:
- Quyền tác giả (Musical Composition): Thuộc về người sáng tác (nhạc lý, lời ca). Cố nhạc sĩ Văn Cao đã hiến tặng bài Tiến Quân Ca cho Nhà nước. Tức là, giai điệu và lời bài hát là Tài sản công (Public Domain), ai cũng có quyền hát.
- Quyền bản ghi âm/ghi hình (Sound Recording/Master Right): Thuộc về người đầu tư sản xuất ra bản thu âm cụ thể đó. Nếu bạn thuê dàn nhạc giao hưởng, thuê ca sĩ thu âm bài Quốc ca trong studio của bạn, bạn sở hữu bản ghi âm đó, chứ không sở hữu bài hát đó.
2. Thuật toán Content ID đã bị "đánh lừa" như thế nào?
Các Network (như BH Media) hoặc các hãng đĩa nước ngoài đã sở hữu một
bản ghi âm bài Quốc ca (ví dụ bản do hãng đĩa Hồ Gươm Audio sản xuất). Họ đã tải bản ghi âm này lên hệ thống Content ID.
Vấn đề kỹ thuật của thuật toán nằm ở đây:
- Trùng lặp tần số âm thanh quá cao: Một bài hát nhạc trẻ khi cover lại sẽ có giọng hát khác, beat khác, Content ID đôi khi phân biệt được bản gốc và bản cover. Nhưng với nhạc giao hưởng/hành khúc như Quốc ca, 10 dàn nhạc kèn đồng thổi cùng một nốt nhạc, cùng một cường độ, cùng một nhịp điệu sẽ tạo ra các dải sóng âm (audio wave) và vân tay kỹ thuật số (fingerprint) gần như y hệt nhau.
- Độ nhạy của AI (Melody Match): YouTube có công cụ quét "Giai điệu". Dù ban tổ chức sân vận động Mỹ Đình phát một bản ghi âm Quốc ca khác hoàn toàn với bản ghi âm mà các Network đã đăng ký, thuật toán Content ID vẫn thấy giai điệu quá giống nhau. Nó lập tức "bắt nhầm" (False Positive) và quăng ra một Content ID Claim.
3. Tại sao các kênh truyền hình phải tự "tắt tiếng"?
Sự sợ hãi về rủi ro thuật toán. Khi livestream một trận bóng đá có hàng triệu lượt xem:
- Nếu để tiếng Quốc ca, hệ thống AI quét trúng. Mặc dù nó chỉ là Claim (nhận vơ doanh thu) chứ chưa chắc là Strike (đánh gậy xóa kênh), nhưng toàn bộ doanh thu quảng cáo của luồng live đó (có thể lên tới hàng chục nghìn USD) sẽ tự động chạy vào túi của đơn vị đã đăng ký bản thu bài Quốc ca trên Content ID.
- Để kháng cáo (Dispute), kênh phải đợi từ 7 đến 30 ngày. Trong thời gian đó, tiền vẫn bị giữ. Đôi khi trong lúc tranh chấp, đối phương nổi cáu có thể sử dụng quyền DMCA để biến Claim thành Strike, dẫn đến sập luồng livestream ngay lập tức.
- Cách an toàn nhất về mặt kỹ thuật: Tắt tiếng 2 phút hát Quốc ca để "né" dấu vân tay âm thanh của máy quét YouTube.
4. Kẽ hở trong quy trình kiểm duyệt của YouTube
Sự việc Quốc ca phơi bày điểm yếu lớn nhất của hệ thống bản quyền YouTube:
Sự thiên vị đối với Network lớn và nguyên tắc "Guilty until proven innocent" (Có tội cho đến khi chứng minh được sự vô tội).
- Thuật toán cho phép các Network lớn (người nắm công cụ CMS Content ID) đăng ký bừa bãi các nội dung Tài sản công (Public domain) hoặc nhạc dân ca, nhạc truyền thống vào hệ thống.
- YouTube không có AI đủ mạnh để xác minh: "Ê, bài này là tài sản quốc gia, anh chỉ có quyền với bản ghi của anh, anh không được lấy nó làm Reference File để quét toàn cầu".
- Hậu quả là gánh nặng chứng minh sự trong sạch bị đẩy hoàn toàn về phía các nhà sáng tạo nội dung (người bị đánh bản quyền).
KẾT LUẬN
Thuật toán đánh bản quyền của YouTube (Content ID) là một kỳ quan về kỹ thuật xử lý dữ liệu lớn, có khả năng băm và so khớp hàng triệu giờ video mỗi ngày. Tuy nhiên, nó là một cỗ máy
mù lòa về mặt pháp lý và ngữ cảnh.
Trường hợp bài Quốc ca là minh chứng rõ nhất cho việc thuật toán chỉ biết so sánh "tần số sóng âm thanh giống nhau" chứ không thể phân biệt được đâu là "quyền tác giả thuộc về nhân dân" và đâu là "quyền bản ghi âm thương mại". Điều này tạo kẽ hở cho hiện tượng "nhận vơ bản quyền" trục lợi, buộc người dùng phải tự bảo vệ mình bằng những cách cực đoan như tắt tiếng nội dung thiêng liêng.