Các định dạng nhạc số
Audio Kiến thức thiết bị giải trí cao cấp

Tìm hiểu các định dạng nhạc số

Chúng ta thường nghe nói tới định dạng nhạc số .wav, .flac và .mp3. Đó là 3 định dạng khác nhau của các file âm thanh được lưu trữ trên máy tính, đại diện cho 3 cách lưu trữ âm thanh khác nhau: không nén (uncompressed), nén nhưng bảo toàn nội dung (lossless), và nén không bảo toàn nội dung (lossy).

Nhưng trước tiên, ta cần biết về điều biến mã xung cũng như những yếu tố căn bản của định dạng âm thanh.

Điều biến mã xung: PCM – Pulse Code Modulation:

Được tạo ra từ năm 1937 và là tiền thân cho các loại âm thanh analog. PCM là một trong những công nghệ đầu tiên hỗ trợ chuyển tín hiệu sóng âm (analog) thành kĩ thuật số (digital). Nôm na là nhờ PCM, chúng ta mới có thể nghe nhạc trên máy tính, đầu đĩa CD thay vì đĩa than, vinyl hay băng cát sét như các bậc cha ông trước đây.
PCM được đặc trưng bởi hai thành phần:
+ tần số mẫu (sample rate): cho biết số lần biên độ rung mỗi giây của sóng âm thanh
+ độ dày của bit (bit depth): Bit đơn giản là những mã nhị phân (số 0 và số 1) dùng để tạo ra dữ liệu – hay những file nhạc mà chúng ta tải về. Bit depth sẽ cho biết số lượng các bit được sử dụng để lưu trữ tín hiệu âm thanh.

định dạng nhạc số
Nếu như bit liên quan đến level (mức) thì sample rate (tần số lấy mẫu) lại liên quan đến thời gian. Nói cách khác, sample rate cho biết số lần tín hiệu âm thanh được đo và lấy mẫu trong một giây.

Để dễ hiểu hơn, chúng ta sẽ lấy ví dụ thực tế:

– Khi tín hiệu âm thanh được lưu lại ở 16-bit depth với tần số lấy mẫu 44.1 kHz thì mỗi giây tín hiệu nhận được sẽ bị cắt thành 44.100 lát và mỗi lát có 65.536 level (độ dài trường dữ liệu là 16 bit, 1 bit giá trị có thể là 0 hoặc 1, –> tổng số level là 2 mũ 16 = 65.536).

– Khi tín hiệu âm thanh được lưu lại ở 24-bit depth với tần số lấy mẫu 96 kHz thì mỗi giây tín hiệu nhận được sẽ bị cắt thành 96.000 lát và mỗi lát có 16.777.216 level.

Phân biệt 3 cách lưu trữ âm thanh tương ứng các định dạng nhạc số

  1. Không nén (uncompressed): định dạng nhạc số WAV, AIFF

WAV là dạng file âm thanh không nén dựa trên định dạng PCM, được phát triển bởi Microsoft và IBM vào năm 1991 để giúp người dùng sử dụng dễ dàng hơn trên các máy Windows. Tuy nhiên ở thời điểm hiện tại WAV đã trở nên phổ biến trên cả Mac và Windows. Nếu được lấy mẫu với tần số 44.1 kHz tức 16 bit (tương đương với chất lượng CD) thì 1 phút âm thanh sẽ tiêu tốn tới 10 MB ổ cứng.

44100 Hz x 2 kênh trái phải x 2 bytes (16 bit = 2 bytes) x 60 giây = 10.584.000 bytes = 10.1 MB.

WAV dạng này thường được thu âm thanh (bài hát, diễn văn…) theo dạng thô và sau đó được xử lý bằng các thiết bị phòng thu hoặc phần mềm chuyên biệt để xuất ra các dạng file chiếm dung lượng ít hơn.

Điều này giải thích tại sao, thông thường 1 đĩa CD có dung lượng 750 MB sẽ lưu được khoảng 74 phút nhạc, tương ứng bit rate chuẩn của âm thanh gốc là 44100 Hz X 2 kênh X 16bit = 1411 kbps (Kilobits/second)

Giống như WAV, AIFF cũng dựa trên công nghệ PCM, nhưng được phát triển bởi Apple cho các máy Mac của mình. Ngoài ra AIFF còn có các phiên bản khác là AIFF-C và Apple Loops, được sử dụng bởi các phần mềm làm nhạc GarageBand và Logic Pro. Tuy được thiết kế cho Mac, các máy Windows vẫn có thể sử dụng định dạng này một cách bình thường.

  1. Nén nhưng bảo toàn nội dung (định dạng nhạc số lossless)

Các định dạng nhạc số Lossless :FLAC, ALAC, APE.

Nếu dùng máy tính, bạn sẽ không xa lạ gì với Zip hay Rar – 2 phần mềm có khả năng giảm thiểu dung lượng file một cách đáng kể, nhưng dữ liệu của nó thì vẫn y nguyên. Đó cũng là mục đích của công việc nén không mất dữ liệu (lossess compression): giữ nguyên tín hiệu của âm thanh gốc.

Làm điều đó như thế nào? Đơn giản, nó sử dụng thuật toán để tìm ra quy luật lặp của dữ liệu, sau đó tìm 1 cách hiển thị khác tối ưu hơn, tốn ít dữ liệu hơn

FLAC được viết tắt từ Free Lossless Audio Codec, cũng được thiết kế để lưu trữ âm thanh giống WAV nhưng được nén bằng các giải thuật khác nhau. Thường thì một file định dạng FLAC có cùng tần số lấy mẫu sẽ có dung lượng chỉ bằng 1/2 dung lượng của file WAV (tức là chiếm khoảng 5MB cho một phút âm thanh). Các thuật toán nén trong FLAC không gạt bỏ bất cứ một tín hiệu âm thanh nào và bạn hoàn toàn có thể giải nén từ một file FLAC ra thành một file WAV.

– APE: Monkey’s audio

Đây cũng là định dạng lossless thông dụng, tuy nhiên nó chưa phổ biến trên các máy mp3 bằng flac vì một chip âm thanh giải mã mp3 là hiển nhiên và việc giải mã flac không phức tạp hơn mp3 bao nhiêu, vì thế chẳng ngại gì mà các nhà sản xuất ko apply flac vào chip âm thanh, với APE thì khó hơn, hiện nay các máy cowon và sansa có hỗ trợ APE.

– ALAC còn gọi là M4A: Apple lossless audio code

Định dạng này được sáng lập bởi apple, dành riêng cho các thiết bị của họ, sau này nó trở nên phổ biến hơn khi đc sử dụng trên các thiết bị của hãng khác, tuy nhiên vẫn không phổ biến như flac hay Ape

 FLAC khác gì APE ?
Điều này cũng giống như bạn so sánh Zip với Rar ở chỗ đều là lossless nhưng giải thuật khác nhau, tạo ra bởi 2 công ty khác nhau. Độ phức tạp của ape hơn flac. Hiện tại maximum compression của Flac vào khoảng 1/2 file wave gốc. Nhưng lập lại lần nữa là chất lượng của nó là như nhau và bằng file gốc.

Trên thực tế, dữ liệu âm thanh trong 1 bản thu cực kỳ đa dạng và sử dụng nhiều dữ liệu nên việc nén không có hiệu quả tối đa như Zip hay Rar đâu. Hiện tại, độ nén cao nhất có thể của kỹ thuật lossless compression là bằng khoảng 1/3 => 1/2 dung lượng gốc của âm thanh gốc, mỗi album lossless sẽ có dung lượng khoảng 200 đến 300 Mb.

  1. Nén không bảo toàn nội dung (định dạng nhạc số lossy)

Ở cái thời Internet chậm như rùa bò, giá ổ cứng thì đắt đỏ, việc download hay lưu trữ một đĩa nhạc CD với dung lượng hơn 700 MB tốn rất nhiều và thời gian, công sức. Đó là lý do tại sao những định dạng “nén mất dữ liệu” (lossy) ra đời, bằng cách hi sinh chất lượng và độ chính xác của âm thanh để giảm nhẹ dung lượng file nhạc.

Ngoài ra, tai con người cũng chỉ có khả năng cảm nhận những âm thanh có tần số nằm trong khoảng 16Hz – 20KHz, tần số ở ngoài dải âm này sẽ bị thuận toán nén loại bỏ. Việc này vừa tiết kiệm được số lần lấy mẫu cũng như số bit để mã hóa, từ đó tiết kiệm được dung lượng tối đa.

Ngoài ra, khi đã nén sang định dạng lossy, chúng ta không thể chuyển đổi nó lại chất lượng như ban đầu như lossless. Nôm na là định dạng nhạc số WAV có thể convert sang định dạng nhạc số FLAC và ngược lại mà vẫn giữ nguyên chất lượng âm thanh, còn định dạng WAV sang định dạng mp3 128 kbps thì vĩnh viễn mất đi chất lượng của file gốc.

Các định dạng nhạc số lossy : MP3, AAC, WMA, Vorbis

– MP3 – MPEG 1 Audio Layer 3 là định dạng âm thanh “dễ mất dữ liệu” phổ biến nhất hiện nay. Cho dù vấn đề về bằng sáng chế đối với sản phẩm này vẫn còn chưa được giải quyết.
Ta thường thấy Mp3 hay được nén với bitrate là 128, hoặc 192, hoac 320 kilobit 1 giây (kbps). Bạn có thể nhận thấy rằng nó chỉ bằng 1/10 so với biterate của WAV (1411kbps) đó là lí do tại sao 1 phút nhạc mp3 128kbps chỉ tốn khoảng 1Mb.
Làm được điều này, các thuật toán nén sẵn sàng bỏ bớt dữ liệu mà vẫn không ảnh hưởng quá nhiều tới chất lượng chung của file.
Ngoài ra các định dạng âm thanh này còn tạo ra những âm thanh giả nhằm đắp vào những phần nó đã loại bỏ, điều này là thực sự không thể chấp nhận được, nó tạo ra những âm thanh ta hay gọi là “éo éo” hoặc vang hoặc méo hẳn so với âm chuẩn, đối với những file được nén với bitrate càng thấp thì hiện tượng này xảy ra càng nhiều. Trong một số trường hợp nhất định, hoặc 1 dạng âm thanh/nhạc nào đó, sẽ rất khó phân biệt sự khác nhau giữa âm thanh gốc và mp3, nhất là với tai nghe người bình thường. Bên cạnh đó các thuật toán nén của các định nhạc mất dữ liệu đã được cải thiện rất nhiều. Thế nhưng không có gì hoàn hảo, và chắc chắn cái gì đã mất đi thì sẽ làm cho nó hỏng đi. Đặc biệt là âm thanh. Đối với những album nhạc như vocal, nhạc cụ, hay đặc biệt là cổ điển thì đây là 1 tai họa. Với những album nhạc này, thường những nhạc cụ được sử dụng hoặc giọng hát có tần số âm thanh rất cao hay rất trầm do đó rất nhiều dữ liệu đã bị loại bỏ hoặc điều chỉnh khác đi so với thực tế.

– Vorbis – Một loại định dạng “dễ mất dữ liệu” miễn phí với mã nguồn mở. Thường được sử dụng cho các game PC như Unreal Tournament 3

– AAC – Advanced Audio Coding : một loại định dạng chuẩn hiện nay được sử dụng cho loại video MPEG 4. Nó được rất nhiều người ưa chuộng nhờ khả năng tương thích với các hệ thống quản lý quyền sử dụng kĩ thuật số (Digital rights management – DRM) chẳng hạn như phần mềm Fairplay của Apple. Sự vượt trội so với định dạng MP3, và đặc biệt là người ta có thể chia sẻ những nội dung trong định dạng này một cách thoải mái mà không cần thủ tục nào cả.

– WMA – Windows Media Audio : định dạng âm thanh “ dễ mất dữ liệu” của Microsoft. Định dạng này đầu tiên được phát triển và sử dụng nhằm tránh những vấn đề giấy phép cho các sản phẩm sử dụng định dạng MP3. Tuy nhiên, nhờ những cải tiến liên tục cùng khả năng tương thích với các hệ thống kiểm duyệt quyền quản lý kĩ thuật số (DRM), WMA vẫn rất phổ biến cho đến khi iTunes trở thành nhà vô địch trong thế giới nhạc DRM.
—————————
Vậy thì nên lưu lại các file âm thanh theo định dạng nhạc số nào? Điều này còn tùy vào ba yếu tố:
+ bạn muốn nghe âm thanh như thế nào
+ bạn đòi hỏi chất lượng âm thanh ra sao
+ thiết bị phát âm thanh của bạn (loa, headphone…) đáp ứng được tới đâu.

Nguồn: Tổng hợp và biên tập

Trả lời

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *