Utf-8 là gì

Intro

Đây là bài bác dịch đầu tiên trong series về Elixir và Unicode của người sáng tác Nathan Long, Các chúng ta có thể phát âm phần 2 tại đâyBài gốc: Part 1 | Part 2Đây là một trong series hết sức chi tiết với dễ nắm bắt, mình tất cả sửa đổi cùng bổ sung cập nhật 1 chút ít, mong muốn đưa về đến hầu như bạn 1 ánh nhìn rõ ràng tốt nhất về Unicode và UTF-8, thiết bị bọn họ gặp mặt không ít nhưng không chắc hẳn vẫn biết rõ

*

(Shame on other languages

*

Source: Zazzle

Trước lúc nói về Unicode, hãy nói về ASCII, thứ nhưng những người dân nói tiếng Anh như tôi lúc nhắc đến đã suy nghĩ ngay lập tức tới các đoạn văn uống bạn dạng thông thường. Nếu chạy lệnh man ascii bên trên trang bị của bạn, bạn sẽ nhận ra công dụng tương tự như như vậy này.

*

Về cơ phiên bản, ASCII dễ dàng là 1 cách ánh xạ (mapping) tự kí trường đoản cú sang trọng số. Đây là sự gật đầu giữa những lập trình viên rằng chữ a hoa, A, hoàn toàn có thể được màn trình diễn ngay số 65 với tương tự cho những kí từ khác (Tại sao lại là 65 ??? có lí vì riêng đến bài toán này đấy

*

Tạm thời họ vẫn ổn định cùng với bí quyết encode này, tuy vậy họ ước ao viết nhiều hơn thế phần đa kí tự thông thường. Chúng ta mong muốn viết:

Những kí trường đoản cú đi kèm theo với trọng âm

á é í ó ú ü ñ ź đẹp trai

Chữ Hi Lạp

λ φ θ Ω

Kí hiệu tân oán học

∫f(x)dx ∞ △ABC ~ △DEF

Chữ tượng hình Trung Quốc

夜露死苦

Vẽ toắt con dĩ nhiên cũng ko bị tiêu diệt ai đâu nhỉ


Chuyên mục: Công Nghệ