|
數奇雜記 |
|
|
2007년 6월 24일 (일요일) 비... 장마
KRISTAL은 현재는 별로 원래 이름에 신경안쓰지만 Knowledge Retrieval In Science & Technology Affiliated Literatures라는 긴 이름을 가지고 있다. 그래서 (개인적으로나마) 과학기술 데이터의 색인 및 검색에도 고려를 하고 있는 편이다. 지금까지는 DNA 염기서열과 단백질 아미노산 서열에 대한 색인 및 검색기법을 제공하고 있다. 또 다른 색인/검색 기법의 하나로 화학분야에서 사용하는 분자식 및 구조식 색인에 대해서도 검토를 해보고자 사전조사를 진행중이다.
SMILES(simplified molecular input line entry specification) 는 업계에서 주로 사용하고 있는 것 같고 국제표준으로는 IUPAC 에서 2000-2004년간에 제정한 InChI(International Chemical Identifier) 가 사용되고 있는 것 같다.
다음은 바이아그라의 이차원 구조식, SMILES 구조식 2개, InChI 구조식을 보여주고 있다. (2차원 구조식과 SMILES 구조식은 Daylight 에서 InChI 구조식은 미국 NIST에서 참조하였다.)
비아그라(Viagra)
Viagra는 sildenafil citrate라는 물질의 상품명이다. 분자식과 구조식 색인에 대해서 분석을 하다가 SMILES와 InChI의 두 가지 방식이 대표적인 것을 알았다. SMILES는 업계 표준, InChI는 국제 표준 정도로 인식하면 될까? 그런데 SMILES가 InChI에 비해 더 쉬워보인다. 그래서 서로 대치하고 있는 것일까?
| 문의나 조언은 메일로... | 저작권 |