인공지능3 [프로젝트] Dream Olfactory Challenge 2024 Dream Olfactory Challenge 2024 회고록 (2024.05.01 ~ 2024.08.02)나의 첫 인공지능 프로젝트로, Synapse에서 진행하는 Dream Olfactory Challenge이다. 해당 챌린지에서 요구한 Task는 2개의 분자 혼합물 간의 냄새 유사도 예측이다. 우리에게 주어진 데이터로는, Mixture의 구성 요소인 CID 리스트와, 2개의 Mixture 쌍과 유사도 수치가 있다. 최종적으로 제출한 모델의 아키텍처는 아래와 같다. 프로젝트 내의 역할초기에 전체적인 모델의 아키텍처를 구상할 때, 화학 분자와 후각 수용체 단백질로 2가지 컴포넌트로 이루어져 있었다. 아무래도 후각을 예측하기 위해서 Mixture를 구성하는 화학 성분도 중요하지만, 이에 반응하는 사람의 후.. 2024. 9. 1. [머신 러닝 교과서] 머신 러닝의 학습 방법 1. 머신 러닝 : 대량의 데이터 분석 및 규칙 유도하여 모델 생성 2. 머신 러닝의 종류 1) 지도 학습 : 레이블된 훈련 데이터 → 미래의 데이터 예측 분류 : 범주형 클래스 레이블 예측 - 이진 분류일 때, 음성/양성 클래스로 분류 - 결정 경계(decision boundary, 두 클래스를 구분할 수 있는 규칙) 학습 회귀 : 연속적인 출력 값 예측 - 예측 변수(특성)와 반응 변수(타깃)와의 관계 학습 - 데이터 포인트와 직선 사이의 거리가 최소 되는 직선 2) 강화 학습 : 환경과 상호작용 → 에이전트(시스템) 성능 향상 - 보상 함수를 이용한 피드백 (얼마나 행동이 좋은지 측정한 값) - 행동 수행 > 피드백 > 보상 최대화하여 행동 학습 3) 비지도 학습 : 레이블되지 않거나 구조를 알 수.. 2024. 3. 12. 원-핫 인코딩 (One-Hot Encoding) 원-핫 인코딩 (One- Hot Encoding) 1. 인코딩이란? 어떠한 정보를 다른 형태로 바꾸는 행위를 인코딩이라 한다. 인공지능에 데이터를 넣어줄 때 컴퓨터가 이해할 수 있는 방식의 데이터로 변환해야 하므로 중요한 개념 중 하나이다. 2. 원-핫 인코딩 자연어 처리에서 단어를 숫자로 표현하는 가장 기본적인 방식이다. 1단계. 단어 집합에 속한 모든 단어에 고유한 정수를 각각 부여 2단계. 표현하고자 하는 단어에 해당하는 정수를 인덱스로 하는 위치에 1 부여, 나머지 0 부여 * 단어 집합 : 서로 다른 단어들의 집합 (500개의 단어가 존재하면 단어 집합의 크기도 500이다) 3. 과정 "나는 오늘 아침부터 학교를 간다"라는 문장을 기준으로 원-핫 인코딩을 통해 수행한다고 하자. [1단계] 문장의.. 2024. 2. 25. 이전 1 다음