본문 바로가기
예바의 LAB

[논문 리뷰] SRDFM (1)

by 예바두비두밥바 2024. 4. 6.

Siamese Response Deep Factorization Machine to improve anti-cancer drug recommendation

항암제 추천도 향상을 위한 SRDFM


Abstract

Personalized treatment 위한 중요한 단계

: Predicting the response of cancer patients to a particular treatment

SRDFM(Siamese Response Deep Factorization Machine) 제안

Siamese Network (SN)

: Architecture, parameters, weights 공유하는 동일한 subnetworks로 구성된 Deep Learning Network

→ 각각의 세포 주와 약 사이의 Relative Position(RP) 측정

∴ real RP와 predicted RP의 차이를 줄여 최적의 SN model 설립

 

Subnetwork

1) Feature Generation Level

  • 약의 속성과 유전자 표현을 통해 concatenated(연관된) feature vector 설계

       → 알려진 화학적 속성 만으로 새로운 약 추천

  • Response unit 발전

      → weighted genetic feature vector 생성 ⇒ 생물학적 상호 작용 시뮬레이션

 

2) Predictor Construction Level

  • Deep Neural Network의 구성 요소와 Factorization Machine(FM)의 구성 요소 통합

    → 개별 화학 정보 처리 및 저차, 고차 기능 상호 작용 학습

 

∴ SRDFM ⇒ single-drug recommendation과 synergic drug combination에 활용

 

Introduction

SRDFM(Siamese Response Deep Factorization Machine)

: 암세포 주와 항암제의 화학적 구조에 기반한 약물 추천

차별점 ↔ exact value가 아닌 약의 rank 계산

            ↔ single drug와 syngeric drug 조합에 모두 작동

  • Siamese network → 각 세포 주의 약물 사이에서 ****relative position(RP) 측정
    • Feature generation level
      • Build a concatenated feature vector→ 새로운 약물에서도 추천 가능

                        _drug property(chemical feature side) & gene expression(genetic feature side)

      • Response Unit→ 특정 약물과 유전자의 생물학적 상호작용 시뮬레이션

                        _genetic feature vector 생성

    • Predictor construction level→ 화학적 정보와 feature 상호작용(Low-order, High-order) 구별 가능

                _factorization machine(FM) 요소를 deep neural network(DNN)로 통합

 

⇒ 예측된 RP와 실제 RP의 차이를 줄여 Optimal SN 모델 생성 → Rank 제공

 

Data Collection

1. Single-drug data sets

  • Genomics of Drug Sensitivity in Cancer (GDSC) → gene expression profiles, response 이용
  • Cancer Cell Line Encyclopedia (CCLE) → gene expression profiles, drug sensitivity measurements 이용
  • SDF(Structural Data Files), PubChem → fingerprints

2. Drug combination data sets

: 23.062 samples, sample 당 2개의 화합물(pairwise combination)1개의 세포 주

Pairwise Combination 38개의 항암제 중 22개 사용, 16개는 조합에만 사용

(self-self combinations X_자신을 조합 X)

 

GDSC와 CCLE의 세포 주와 Pairwise Combination 조합 ⇒ 2개의 Synergy data set

'예바의 LAB' 카테고리의 다른 글

LINUX(리눅스) 명령어  (4) 2024.04.15
[논문 리뷰] SRDFM (2)  (0) 2024.04.14
논문 발표 TIP  (4) 2024.04.06
이분 그래프 (Bipartite graph)  (2) 2024.03.19
패스웨이(Pathway)의 개념과 분석  (4) 2024.03.14