https://doi.org/10.1038/s41422-025-01115-6
요약
- 기존의 peptide 신호 대신 machine learning 기반 위치 예측: 기존에는 nuclear localization signal 등 특정 peptide가 단백질 위치를 결정한다고 알려졌으나, 이 논문은 IDR(무질서 영역)의 sequence 특징만으로도 위치를 예측할 수 있음을 보여줌.
- ProtGPS: 12종의 condensate localization 예측 모델 개발: Kilgore et al.은 ProtGPS라는 단백질 언어 모델 기반 알고리즘을 통해, 세포 내 12종의 biomolecular condensates(핵, PML body, 스트레스 과립 등)로의 단백질 국소화를 AUC 0.83~0.95 수준으로 예측함.
- 새로운 단백질 설계 가능성 입증: ProtGPS를 기반으로 IDR 특성을 갖는 인공 단백질 서열 100-residue를 설계하여, 그중 일부가 실제로 nucleolus 또는 speckle 등 특정 condensate에 국소화됨을 실험으로 확인함.
- 질병 관련 변이가 condensate 국소화에 미치는 영향 분석: ProtGPS를 이용해 질병 관련 변이(missense, truncation 등)가 국소화에 영향을 줄 수 있음을 예측하고, 형광 표지 실험으로 검증함.
- 다양한 질환 연구에 활용 가능성 제시: ProtGPS는 향후 neurodegeneration, 암 등 condensate 관련 질환 메커니즘 해석 및 설계형 단백질 개발에 유용한 도구가 될 수 있음.
Abstract
Proteins within cells must navigate complex intracellular environments to co-localize with partners and regulate functional cellular organization. In a recentScience paper, Kilgore et al. report the development of ProtGPS, a machine learning-trained predictor of protein localization within biomolecular condensates in cells that can be used to predict the ability of disease-linked mutations to dysregulate protein localization to biomolecular condensates.