Dịch Tài Liệu
Dịch Tài Liệu
Phần tiêu đề “Dịch Tài Liệu”Dự án này sử dụng mô hình Haiku 3.5 của AWS Bedrock để tự động dịch tài liệu từ tiếng Anh sang nhiều ngôn ngữ. Hệ thống dịch thuật được thiết kế để hiệu quả, chính xác và dễ sử dụng.
Ngôn Ngữ Được Hỗ Trợ
Phần tiêu đề “Ngôn Ngữ Được Hỗ Trợ”Hiện tại, các ngôn ngữ sau được hỗ trợ:
- Tiếng Nhật (jp)
- Tiếng Pháp (fr)
- Tiếng Tây Ban Nha (es)
- Tiếng Đức (de)
- Tiếng Trung (zh)
- Tiếng Hàn (ko)
Cách Hoạt Động
Phần tiêu đề “Cách Hoạt Động”Hệ thống dịch thuật hoạt động bằng cách:
- Chia tài liệu theo tiêu đề h2 - Điều này cho phép xử lý hiệu quả hơn và cung cấp ngữ cảnh tốt hơn cho mô hình dịch thuật.
- Bảo toàn định dạng markdown - Tất cả cú pháp markdown, khối code và thẻ HTML được bảo toàn trong quá trình dịch.
- Xử lý đặc biệt cho frontmatter - YAML frontmatter được dịch trong khi vẫn bảo toàn cấu trúc của nó.
- Dịch thuật tăng dần - Mặc định chỉ các tệp đã thay đổi mới được dịch, tiết kiệm thời gian và tài nguyên.
Chạy Dịch Thuật Cục Bộ
Phần tiêu đề “Chạy Dịch Thuật Cục Bộ”Để dịch tài liệu cục bộ, sử dụng script scripts/translate.ts:
# Chỉ dịch các tệp đã thay đổi sang tiếng Nhật (mặc định)./scripts/translate.ts
# Dịch tất cả các tệp./scripts/translate.ts --all
# Dịch sang các ngôn ngữ cụ thể./scripts/translate.ts --languages jp,fr,es
# Hiển thị những gì sẽ được dịch mà không thực sự dịch./scripts/translate.ts --dry-run
# Hiển thị đầu ra chi tiết./scripts/translate.ts --verboseGitHub Workflow
Phần tiêu đề “GitHub Workflow”Một GitHub workflow tự động dịch tài liệu khi có thay đổi đối với các tệp tài liệu tiếng Anh trong pull request. Workflow này:
- Phát hiện thay đổi đối với các tệp tài liệu tiếng Anh
- Dịch các tệp đã thay đổi bằng AWS Bedrock
- Commit các bản dịch trở lại nhánh nguồn
- Cập nhật PR với trạng thái dịch thuật
Kích Hoạt Workflow Thủ Công
Phần tiêu đề “Kích Hoạt Workflow Thủ Công”Bạn cũng có thể kích hoạt workflow dịch thuật thủ công từ tab GitHub Actions. Điều này hữu ích cho:
- Chạy dịch thuật đầy đủ cho tất cả tài liệu
- Dịch sang các ngôn ngữ cụ thể
- Cập nhật bản dịch sau khi thực hiện thay đổi đối với script dịch thuật
Cấu Hình AWS
Phần tiêu đề “Cấu Hình AWS”Hệ thống dịch thuật sử dụng mô hình Haiku 3.5 của AWS Bedrock để dịch. Để sử dụng tính năng này, bạn cần:
- Thông tin xác thực AWS - Đối với phát triển cục bộ, cấu hình thông tin xác thực AWS của bạn bằng AWS CLI hoặc biến môi trường.
- IAM Role - Đối với GitHub Actions, cấu hình IAM role với xác thực OIDC và các quyền cần thiết cho AWS Bedrock.
Quyền Yêu Cầu
Phần tiêu đề “Quyền Yêu Cầu”IAM role hoặc user cần các quyền sau:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "bedrock:InvokeModel" ], "Resource": [ "arn:aws:bedrock:*::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" ] } ]}Chất Lượng Dịch Thuật
Phần tiêu đề “Chất Lượng Dịch Thuật”Chất lượng dịch thuật nhìn chung cao, nhưng có một số điều cần lưu ý:
- Thuật ngữ kỹ thuật - Hệ thống được cấu hình để bảo toàn các thuật ngữ kỹ thuật bằng tiếng Anh.
- Khối code - Khối code không được dịch, vì chúng nên giữ nguyên dạng ban đầu.
- Nhận thức ngữ cảnh - Mô hình dịch thuật hiểu ngữ cảnh của tài liệu, điều này giúp ích cho các bản dịch kỹ thuật.
Tùy Chỉnh Dịch Thuật
Phần tiêu đề “Tùy Chỉnh Dịch Thuật”Bạn có thể tùy chỉnh quá trình dịch thuật bằng cách sửa đổi tệp scripts/translate.ts. Một số tùy chỉnh có thể bao gồm:
- Thêm hỗ trợ cho nhiều ngôn ngữ hơn
- Thay đổi mô hình dịch thuật
- Điều chỉnh các prompt được sử dụng cho dịch thuật
- Sửa đổi cách tài liệu được chia và xử lý
Khắc Phục Sự Cố
Phần tiêu đề “Khắc Phục Sự Cố”Nếu bạn gặp vấn đề với quá trình dịch thuật:
- Kiểm tra thông tin xác thực AWS - Đảm bảo thông tin xác thực AWS của bạn được cấu hình đúng cách.
- Kiểm tra vùng AWS - Đảm bảo bạn đang sử dụng vùng có AWS Bedrock khả dụng.
- Chạy với đầu ra chi tiết - Sử dụng cờ
--verboseđể xem nhật ký chi tiết hơn. - Kiểm tra giới hạn tốc độ - AWS Bedrock có giới hạn tốc độ có thể ảnh hưởng đến các công việc dịch thuật lớn.