본문 바로가기
예바의 LAB

[논문 리뷰] Expansive linguistic representations to predict interpretable odor mixture discriminability

by 예바두비두밥바 2024. 7. 5.
 

Expansive linguistic representations to predict interpretable odor mixture discriminability

해석 가능한 냄새 혼합물 구별 가능성을 예측하기 위한 광범위한 언어 표현


Introduction

1. Previous Studies

1) Monomolecular에 대한 후각 연구: 단분자

  • chemoinformatic structural descriptor (화학 정보, 구조에 관한 설명자 활용)
  • semantic descriptors (사람이 해석할 수 있는 의미론적 설명자 활용)

2) Mixtures에 대한 후각 연구: 혼합물

  • chemoinformatic structural descriptor (화학 정보, 구조에 관한 설명자 활용)

Semantic descriptorsMixture 간의 유사도 및 구별 가능성을 예측

 

2. Two Solutions to predict the results of a discriminability test

1. 예측하고자 하는 대상

: Discrimination test의 결과 (피실험자가 올바르게 답한 비율)

 

※ Discrimination test
   : 3개의 혼합물이 주어졌을 때, 셋 중 하나만 다른 종류의 혼합물로 수행
    → 피실험자에게 다른 종류의 혼합물 결정하라고 요청

 

2. 해결 방안

1) Direct Model (기존 논문)

- chemoinformatic descriptors를 사용해 각 혼합물에 대해 화학적 feature로 벡터 추출

- 추출한 2개의 벡터 사이의 각 거리를 계산해 Discrmination test 결과 예측

 

2) Semantic Model (해당 논문)

- semantic descriptors를 사용해 각 혼합물에 대해 21개의 선택된 semantic attributes feature로 Metric 추출

- Metric Learning을 사용해 학습 후 매핑된 Discrmination test 결과로 예측

Figure 1. Predicting discriminability of odor mixtures

 

Methods

1. The overall structure of SEMANTIC MODEL

Figure 2. Metric learning of the Semantic Model for odor mixture discriminability.

 

2. Specific Steps

 

1) Structural descriptors for each molecules in mixtures

    : 혼합물 내의 구조적 속성에 관한 분자 결정 by Dragon descriptors 사용

 

2) Chemo-informatic model predictions for each molecule

     : 결정한 분자에 대해 단분자의 21개의 semantic descriptor feature 예측

      → 아래의 연구에서 구현한 모델 사용

 

3) Average or Maximum to obtain mixture values

     : 단분자 semantic descriptor feature를 평균 혹은 최댓값으로 혼합물의 semantic feature 사용

 

4) Metric Learning to fit MD to % discrimination

     : 혼합물의 semantic feature vector를 혼합물 구별 가능성 결과 값을 목표로 Metric 학습

  • Feature definition

       : 혼합물 A와 B의 i번째 feature 차의 제곱 

  • Lasso Model Training

         - feature vector와 사람의 혼합물 구별 가능성 매핑하며 학습

           (Training dataset : Bushdid et al, 2024로 260개의 혼합물 쌍)

 

         - Lasso linear regression : 유의미하지 않는 변수들에 대한 가중치를 0에 가깝게

            → 최소한의 설명자로 중복된 descriptors 제거 (21개 중 10개 제거)

           ex. wood와 grass의 semantic descriptor는 유사하므로, 둘 중 하나인 grass

Table 1. Weight values for Mahalanobis Metric.
  • Mahalanobis distance metric

        : 주변의 점들의 상대적 위치를 고려하여 나타낸 거리

          → 거리가 짧을수록 두 개의 혼합물 유사

 

             1) Mahalanobis distance로 두 냄새 혼합물 간의 거리 측정

             2) 모델의 출력 값 (판별 가능성 예측 값)을 [0, 1] 구간으로 맞추는 데 사용

 

Results

1. RMSE of the predictions of the Semantic model

Figure 2. Metric learning of the Semantic Model for odor mixture discriminability.
 

2. Comparison of the predicted discriminability

Figure 2. Metric learning of the Semantic Model for odor mixture discriminability.

3. Languages as a measure of smell

Figure 3. Language as a measure of smell.

4. Metric-derived properties of the olfactory space

Figure 4. Metric-derived properties of the olfactory space.

 

5. Density plot representing the 548 predictions (Learned metric) of the Semantic model for the 3 datasets against the experimental results for discriminability

Figure 4. Metric-derived properties of the olfactory space.

 

6. Diagram of the different possibilities of interpretation of the psychometric perceptual curves relative to the existence of olfactory metamers

Figure 4. Metric-derived properties of the olfactory space.