본문 바로가기

예바의 LAB19

패스웨이(Pathway)의 개념과 분석 패스웨이(Pathway) 1. pathway란? : 단백질, 유전자 등의 생체 요소 간의 상호작용을 설명하는 생물학적 심층 지식 * 생합성 경로로 pathway를 번역할 수 있으나, 대부분 사용하지 않는다. 2. 패스웨이 분석 패스웨이 분석은 유전자와 단백질 등을 기반으로 질병과 관련된 패스웨이를 식별한다. 이를 통해, 어떤 현상으로 질병을 일으키는지에 대해 해석할 수 있어 bioinformatics 관련 연구를 하는데 사용된다. 3. KEGG KEGG는 Kyoto Encyclopedia of Genes and Genomes의 약자로, pathway map의 모음이다. 분자 간의 상호작용, 반응 및 관계 네트워크에 대한 여러 종류의 map이 있다. Bioinformatics 분야에서 pathway 분석에.. 2024. 3. 14.
[머신 러닝 교과서] 머신 러닝의 학습 방법 1. 머신 러닝 : 대량의 데이터 분석 및 규칙 유도하여 모델 생성 2. 머신 러닝의 종류 1) 지도 학습 : 레이블된 훈련 데이터 → 미래의 데이터 예측 분류 : 범주형 클래스 레이블 예측 - 이진 분류일 때, 음성/양성 클래스로 분류 - 결정 경계(decision boundary, 두 클래스를 구분할 수 있는 규칙) 학습 회귀 : 연속적인 출력 값 예측 - 예측 변수(특성)와 반응 변수(타깃)와의 관계 학습 - 데이터 포인트와 직선 사이의 거리가 최소 되는 직선 2) 강화 학습 : 환경과 상호작용 → 에이전트(시스템) 성능 향상 - 보상 함수를 이용한 피드백 (얼마나 행동이 좋은지 측정한 값) - 행동 수행 > 피드백 > 보상 최대화하여 행동 학습 3) 비지도 학습 : 레이블되지 않거나 구조를 알 수.. 2024. 3. 12.
원-핫 인코딩 (One-Hot Encoding) 원-핫 인코딩 (One- Hot Encoding) 1. 인코딩이란? 어떠한 정보를 다른 형태로 바꾸는 행위를 인코딩이라 한다. 인공지능에 데이터를 넣어줄 때 컴퓨터가 이해할 수 있는 방식의 데이터로 변환해야 하므로 중요한 개념 중 하나이다. 2. 원-핫 인코딩 자연어 처리에서 단어를 숫자로 표현하는 가장 기본적인 방식이다. 1단계. 단어 집합에 속한 모든 단어에 고유한 정수를 각각 부여 2단계. 표현하고자 하는 단어에 해당하는 정수를 인덱스로 하는 위치에 1 부여, 나머지 0 부여 * 단어 집합 : 서로 다른 단어들의 집합 (500개의 단어가 존재하면 단어 집합의 크기도 500이다) 3. 과정 "나는 오늘 아침부터 학교를 간다"라는 문장을 기준으로 원-핫 인코딩을 통해 수행한다고 하자. [1단계] 문장의.. 2024. 2. 25.