특허

데이터 증강 방법 및 이를 이용한 양성 에피토프 예측모델 생성 방법
데이터 증강 방법 및 이를 이용한 양성 에피토프 예측모델 생성 방법
작성자 라이프사이클 기반 시니어헬스
조회수 403 등록일 2023.03.20

○ 출원등록구분: 출원


○ 출원등록국가: 대한민국


○ 출원등록번호: 10-2023-0013563


○ 출원등록일: 202302


○ 출원자명: 충남대학교 산학협력단


○ 발명자명: 윤휘열


○ 주요내용

본 발명은 컴퓨터를 활용한 신약개발의 한계점 중의 하나인 데이터 부족 문제를, 딥러닝 모델을 활용하여 생물화학적인 근거를 기반으로한 데이터 증강에 관한 것으로, 에피토프의 활성을 예측하는 과정에 특화되어 정확도 있는 예측을 가능하게 해준다.


제약 산업체에서 epitope의 활성화를 머신러닝을 통해 예측하여 이 예측결과로 발병 여부를 예측하는 연구를 진행하고 있지만, B-cell에서의 epitope 활성화에 관련한 데이터가 부족한 문제가 있어 예측력 높은 예측 모델을 만드는 과정에 한계가 있다. 


머신러닝의 특성상 양질의 데이터가 필요하며, 본 발명은 biological한 방법으로 data를 증강시켜 데이터셋을 확보하고 ml/dl에 학습시켜 epitope의 활성화 여부를 보다 더 정확하게 예측할 수 있고, 이 발명을 활용하여 암 치료용 백신 이외의 다양한 신약 개발에 도움을 줄 수 있다.데이터셋에서 얻어온 데이터들을 전처리하여 안티젠을 positive epitope를 제외한 안티젠과 positive epitope로 데이터를 구분하고, 두 부분을 랜덤으로 조합하여 데이터를 증강시켜 준 후에, ML/DL/모델에서 안티젠에서 에피토프가 있는 부분은 1, 이외의 부분은 0으로 classification하고, point anomaly로 positive와 negative부분을 구분하여 학습시킴으로써 새로운 epitope를 투입했을 때, B-cell에 binding 하는지 활성화 여부를 예측해주는 예측부로 구성되어있다.

  

기존 데이터를 biological한 이론을 기반으로 증강하였기 때문에 데이터가 부족한 현 상황에서 본 발명의 방법으로 데이터를 증강시켜 데이터 부족 문제를 해결하고, 다양해진 데이터로 epitope 활성 예측력을 더욱 높일 수 있으며, 이는 항체와 epitope의 활성화 결과로 신약개발에 사용되는 암 치료용 백신, 코로나 19 백신 등 다양한 신약 개발과정에 이바지 할 수 있다.