Các nhà nghiên cứu tại Viện Salk đã tạo ra một bước đột phá trong lĩnh vực di truyền học bằng cách phát triển một công cụ mới tên là ShortStop. ShortStop sử dụng học máy để xác định và khám phá các vùng DNA thường bị bỏ qua trong quá trình tìm kiếm các microprotein – những protein nhỏ có thể đóng vai trò quan trọng trong bệnh tật.

Công cụ này giúp các nhà khoa học nhận diện các vùng DNA có tiềm năng mã hóa microprotein và dự đoán khả năng sinh học của chúng. Điều này không chỉ giúp tiết kiệm thời gian và tiền bạc trong việc tìm kiếm các microprotein liên quan đến sức khỏe và bệnh tật mà còn mở ra những cơ hội mới cho việc nghiên cứu và phát triển điều trị các bệnh phức tạp như ung thư và Alzheimer.
ShortStop hoạt động dựa trên việc phân loại microprotein thành hai loại: chức năng và không chức năng. Quá trình phân loại này dựa trên dữ liệu huấn luyện từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Bằng cách so sánh các microprotein tìm thấy với các mẫu giả, ShortStop có thể nhanh chóng quyết định liệu một microprotein mới có khả năng chức năng hay không.
Trong một nghiên cứu gần đây, khi ShortStop được áp dụng vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã xác định được 8% microprotein có khả năng chức năng. Những microprotein này được ưu tiên cho việc theo dõi tiếp theo. Công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người.
ShortStop đã được sử dụng để phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường. Kết quả là tạo ra danh sách các microprotein tiềm năng chức năng. Một số microprotein nổi bật đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường, cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi.
Việc xác định microprotein liên quan đến ung thư phổi này chứng minh giá trị của ShortStop và học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai. Các nhà nghiên cứu hy vọng rằng ShortStop sẽ giúp họ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật, từ đó mở ra những con đường mới cho việc chẩn đoán và điều trị các bệnh như ung thư phổi và Alzheimer.