Hệ thống phân cấp Chomsky

Trong các lĩnh vực lý thuyết ngôn ngữ hình thức, khoa học máy tính và ngôn ngữ học, hệ thống phân cấp Chomsky là một hệ thống phân cấp các lớp ngữ pháp hình thức hay văn phạm hình thức. Ngữ pháp hình thức mô tả cách tạo chuỗi từ bảng chữ cái của ngôn ngữ có giá trị theo cú pháp của ngôn ngữ đó. Nhà ngôn ngữ học Noam Chomsky đã đưa ra giả thuyết rằng có bốn lớp văn phạm hình thức khác nhau có thể sinh ra các ngôn ngữ ngày càng phức tạp hơn. Mỗi lớp cũng có thể hoàn toàn sinh ra ngôn ngữ của tất cả các lớp thấp hơn, bao gồm cả tập hợp.
Lịch sử
Ý tưởng chung về một hệ thống phân cấp ngữ pháp lần đầu tiên được Noam Chomsky mô tả trong bài viết "Ba mô hình cho việc mô tả ngôn ngữ" trong quá trình chính thức hóa ngữ pháp chuyển đổi – tạo sinh (transformational-generative grammar, TGG).[1] Nhà toán học Marcel-Paul Schützenberger cũng đã đóng vai trò trong sự phát triển của lý thuyết ngôn ngữ hình thức; bài báo "Lý thuyết đại số của ngôn ngữ phi ngữ cảnh"[2] mô tả hệ thống phân cấp hiện đại, bao gồm cả văn phạm phi ngữ cảnh.[3]
Một cách độc lập, bên cạnh các nhà ngôn ngữ học, các nhà toán học cũng đang phát triển các mô hình tính toán (thông qua Automat). Phân tích một câu trong một ngôn ngữ tương tự như tính toán, và các văn phạm do Chomsky mô tả được chứng minh vừa giống vừa tương đương về sức mạnh tính toán với nhiều mô hình máy khác nhau.[4]
Hệ thống phân cấp
| Văn phạm | Ngôn ngữ | Nhận diện automat | Quy tắc sinh (ràng buộc)[a] | Ví dụ[5][6] |
|---|---|---|---|---|
| Loại 3 | Chính quy | Máy trạng thái hữu hạn | , (chính quy phải) hoặc , (chính quy trái) | |
| Loại 2 | Phi ngữ cảnh | Máy tự động đẩy xuống không xác định | ||
| Loại 1 | Cảm ngữ cảnh | Máy Turing không xác định giới hạn tuyến tính | ||
| Loại 0 | Ngữ cấu | Máy Turing | ( không được rỗng) | mô tả một máy Turing kết thúc |
- ↑ Giải thích biểu tượng:
- = Ký hiệu kết thúc
- , = Ký hiệu không kết thúc
- , , = Chuỗi ký hiệu kết thúc và/hoặc không kết thúc
Mỗi ngôn ngữ chính quy đều là ngôn ngữ phi ngữ cảnh, mỗi ngôn ngữ phi ngữ cảnh đều là ngôn ngữ cảm ngữ cảnh, mỗi ngôn ngữ cảm ngữ cảnh đều là ngôn ngữ ngữ cấu (ngôn ngữ tổng quát, ngôn ngữ không hạn chế) và mỗi ngôn ngữ ngữ cấu đều có thể đếm đệ quy. Tất cả đều là các bao hàm chính xác, có nghĩa là tồn tại các ngôn ngữ có thể đếm đệ quy mà không phải ngôn ngữ cảm ngữ cảnh, các ngôn ngữ cảm ngữ cảnh mà không phải là ngôn ngữ phi ngữ cảnh, và các ngôn ngữ phi ngữ cảnh mà không phải là ngôn ngữ chính quy.[7]
Văn phạm chính quy
Văn phạm mà các quy tắc sinh của nó có dạng , (hay tuyến tính phải, chính quy phải) hoặc , (hay tuyến tính trái, chính quy trái), trong đó: và thì được gọi là văn phạm chính quy hoặc văn phạm loại 3.
Văn phạm phi ngữ cảnh
Văn phạm mà các quy tắc sinh của nó có dạng , trong đó: và thì được gọi là văn phạm phi ngữ cảnh hoặc văn phạm loại 2.
Văn phạm cảm ngữ cảnh
Văn phạm mà các quy tắc sinh của nó có dạng , trong đó: ; và thì được gọi là văn phạm ngữ cảnh hoặc văn phạm loại 1.
Văn phạm ngữ cấu
Văn phạm mà các quy tắc sinh có dạng , trong đó và thì được gọi là văn phạm ngữ cấu hoặc văn phạm loại 0.
Chú thích
Tham khảo
- ↑ Chomsky 1956.
- ↑ Chomsky & Schützenberger 1963.
- ↑ Allott, Nicholas; Lohndal, Terje; Rey, Georges (ngày 27 tháng 4 năm 2021). "Synoptic Introduction". A Companion to Chomsky. tr. 1–17. doi:10.1002/9781119598732.ch1. ISBN 9781119598701. S2CID 241301126.
- ↑ Kozen, Dexter C. (2007). Automata and computability. Undergraduate Texts in Computer Science. Springer. tr. 3–4. ISBN 978-0-387-94907-9.
- ↑ Geuvers, H.; Rot, J. (2016). "Applications, Chomsky hierarchy, and Recap" (PDF). Regular Languages. Lưu trữ (PDF) bản gốc ngày 19 tháng 11 năm 2018.
- ↑ Sudkamp, Thomas A. (1997) [1988]. Languages and machines: An Introduction to the Theory of Computer Science. Reading, Massachusetts, USA: Addison Wesley Longman. tr. 310. ISBN 978-0-201-82136-9.
- ↑ Chomsky, Noam (1963). "Chapter 12: Formal Properties of Grammars". Trong Luce, R. Duncan; Bush, Robert R.; Galanter, Eugene (biên tập). Handbook of Mathematical Psychology. Quyển II. John Wiley and Sons, Inc. tr. 323–418.
Tài liệu
- Chomsky, Noam (1956). "Three models for the description of language" (PDF). IRE Transactions on Information Theory. 2 (3): 113–124. doi:10.1109/TIT.1956.1056813. S2CID 19519474. Lưu trữ (PDF) bản gốc ngày 7 tháng 3 năm 2016.
- Chomsky, Noam (1959). "On certain formal properties of grammars" (PDF). Information and Control. 2 (2): 137–167. doi:10.1016/S0019-9958(59)90362-6.
- Chomsky, Noam; Schützenberger, Marcel P. (1963). "The algebraic theory of context free languages". Trong Braffort, P.; Hirschberg, D. (biên tập). Computer Programming and Formal Systems (PDF). Amsterdam: North Holland. tr. 118–161. Lưu trữ (PDF) bản gốc ngày 13 tháng 6 năm 2011.