Siamese Response Deep Factorization Machine to improve anti-cancer drug recommendation
항암제 추천도 향상을 위한 SRDFM
Abstract
Personalized treatment 위한 중요한 단계
: Predicting the response of cancer patients to a particular treatment
→ SRDFM(Siamese Response Deep Factorization Machine) 제안
Siamese Network (SN)
: Architecture, parameters, weights 공유하는 동일한 subnetworks로 구성된 Deep Learning Network
→ 각각의 세포 주와 약 사이의 Relative Position(RP) 측정
∴ real RP와 predicted RP의 차이를 줄여 최적의 SN model 설립
Subnetwork
1) Feature Generation Level
- 약의 속성과 유전자 표현을 통해 concatenated(연관된) feature vector 설계
→ 알려진 화학적 속성 만으로 새로운 약 추천
- Response unit 발전
→ weighted genetic feature vector 생성 ⇒ 생물학적 상호 작용 시뮬레이션
2) Predictor Construction Level
- Deep Neural Network의 구성 요소와 Factorization Machine(FM)의 구성 요소 통합
→ 개별 화학 정보 처리 및 저차, 고차 기능 상호 작용 학습
∴ SRDFM ⇒ single-drug recommendation과 synergic drug combination에 활용
Introduction
SRDFM(Siamese Response Deep Factorization Machine)
: 암세포 주와 항암제의 화학적 구조에 기반한 약물 추천
차별점 ↔ exact value가 아닌 약의 rank 계산
↔ single drug와 syngeric drug 조합에 모두 작동
- Siamese network → 각 세포 주의 약물 사이에서 ****relative position(RP) 측정
- Feature generation level
- Build a concatenated feature vector→ 새로운 약물에서도 추천 가능
- Feature generation level
_drug property(chemical feature side) & gene expression(genetic feature side)
-
-
- Response Unit→ 특정 약물과 유전자의 생물학적 상호작용 시뮬레이션
-
_genetic feature vector 생성
-
- Predictor construction level→ 화학적 정보와 feature 상호작용(Low-order, High-order) 구별 가능
_factorization machine(FM) 요소를 deep neural network(DNN)로 통합
⇒ 예측된 RP와 실제 RP의 차이를 줄여 Optimal SN 모델 생성 → Rank 제공
Data Collection
1. Single-drug data sets
- Genomics of Drug Sensitivity in Cancer (GDSC) → gene expression profiles, response 이용
- Cancer Cell Line Encyclopedia (CCLE) → gene expression profiles, drug sensitivity measurements 이용
- SDF(Structural Data Files), PubChem → fingerprints
2. Drug combination data sets
: 23.062 samples, sample 당 2개의 화합물(pairwise combination)과 1개의 세포 주
Pairwise Combination → 38개의 항암제 중 22개 사용, 16개는 조합에만 사용
(self-self combinations X_자신을 조합 X)
GDSC와 CCLE의 세포 주와 Pairwise Combination 조합 ⇒ 2개의 Synergy data set
'예바의 LAB' 카테고리의 다른 글
LINUX(리눅스) 명령어 (4) | 2024.04.15 |
---|---|
[논문 리뷰] SRDFM (2) (0) | 2024.04.14 |
논문 발표 TIP (4) | 2024.04.06 |
이분 그래프 (Bipartite graph) (2) | 2024.03.19 |
패스웨이(Pathway)의 개념과 분석 (4) | 2024.03.14 |