🧬Low-pass WGS: công nghệ giải trình tự bộ gene người với chi phí thấp
- Chăm sóc khách hàng KTEST
- 5 thg 8
- 3 phút đọc

CÔNG NGHỆ GIẢI TRÌNH TỰ BỘ GENE – GIẢI PHÁP TIÊN TIẾN TRONG Y HỌC HIỆN ĐẠI
Các công nghệ giải trình tự bộ gene nhằm xác định các biến thể di truyền ngày càng được ứng dụng rộng rãi trong y học. Việc xác định bộ biến thể ở người có thể giúp dự đoán nguy cơ mắc bệnh, phát hiện sớm các bệnh di truyền và từ đó có các phương án điều trị hiệu quả. Bên cạnh đó, xác định bộ biến thể cũng giúp phân tích mối tương quan với các tính trạng khác nhau (BMI, chiều cao, dinh dưỡng, thể chất và tinh thần,…) giúp khám phá đặc điểm của một cá nhân.
GIẢI TRÌNH TỰ TOÀN BỘ HỆ GENE (WGS) VÀ CÁC PHƯƠNG PHÁP PHỔ BIẾN HIỆN NAY
Giải trình tự toàn bộ hệ gene (whole genome sequencing, WGS) là phương pháp điển hình để xác định toàn bộ biến thể, tuy nhiên thường chi phí cao do yêu cầu độ phủ của các trình tự (sequencing depth) khoảng từ 30X. Sau đó, công nghệ SNP array được xem là phương án thay thế với ưu điểm nổi bật là chi phí thấp và yêu cầu tài nguyên tính toán thấp. Công nghệ này phát hiện các biến thể dựa trên phương pháp lai giữa trình tự cần xác định với mẫu dò chứa biến thể đã biết trước, do đó bị giới hạn trong phát hiện biến thể mới, biến thể hiếm và chưa tối ưu cho các dân tộc khác nhau trên thế giới.
LOW-PASS WGS: CÔNG NGHỆ GIẢI TRÌNH TỰ TỐI ƯU VÀ TIẾT KIỆM CHI PHÍ
Giải trình tự với độ phủ thấp (low-pass WGS) là công nghệ giải trình tự WGS nhưng độ phủ chỉ từ 0,5X đến 2X – tức là ít dữ liệu hơn, ít hao tốn tài nguyên hơn, ít chi phí hơn nhưng vẫn đủ để suy đoán toàn bộ hệ gene thông qua kết hợp xử lý dữ liệu giải trình tự bằng các thuật toán suy diễn biến thể (imputation). Để chứng minh phương pháp này hiệu quả, KTest đã thực hiện nghiên cứu so sánh hiệu quả của hai phương pháp thu thập dữ liệu gene –low-pass WGS và SNP array – trong tính toán chỉ số đa gene (polygenic score - PGS) và độ chính xác suy diễn biến thể (imputation) cho nhiều nhóm dân tộc khác nhau.
🔍 THIẾT KẾ NGHIÊN CỨU
Thu thập dữ liệu từ 2,504 cá thể thuộc Dự án 1000 Genomes
Phân tích so sánh dữ liệu của 8 loại SNP array và 6 mức độ phủ từ 0.5x đến 2.0x của WGS
Đánh giá trên 5 nhóm dân số: Châu Phi (AFR), Châu Mỹ (AMR), Châu Âu (EUR), Nam Á (SAS), Đông Á (EAS)
Tập trung vào các biến thể hiếm và phổ biến cho 4 bệnh lý/đặc tính: chiều cao, BMI, tiểu đường típ 2, và hội chứng chuyển hóa
📈 KẾT QUẢ NỔI BẬT
Low-pass WGS có độ chính xác suy diễn cao hơn SNP array trong nhóm dân số ít được đại diện và ở các biến thể hiếm.
Với độ phủ ≥1,0X, WGS đạt hiệu quả tính toán PGS tương đương hoặc vượt SNP array
Các SNP array tối ưu cho từng nhóm dân cư (như JAPONICA cho EAS, UKB_WCSG cho EUR) hoạt động tốt, nhưng độ linh hoạt kém khi mở rộng sang nhóm khác.
WGS giữ vững hiệu quả ổn định xuyên suốt các nhóm dân số
Kết quả đã được công bố tại trên tạp chí khoa học và báo cáo tại hội nghị Di truyền và Hệ gene y học toàn quốc 2025.
📚 THAM KHẢO BÀI BÁO
Imputation and polygenic score performance of low coverage whole-genome sequencing and genotyping arrays in diverse human populations
Phi Truong Nguyen, Thuy Vy Nguyen, Dat Thanh Nguyen, Thuy Duong Ho Huynh. bioRxiv 2025.07.18.665609; doi: https://doi.org/10.1101/2025.07.18.665609




Bình luận