제3자가 소유한 데이터베이스(DB) 서버를 활용할 때, 가장 중요한 이슈 중 하나는 개인정 보를 보호하는 것이다. 가장 간단한 방법은 클라이언트가 데이터를 암호화한 후 서버에 위탁 하는 것이다. 이와 관련된 DB 암호화 시장은 2019년 7억 달러에서 2027년 57달러 규모로 성장할 것으로 예상되고 있다[1]. 국내에서도 한컴시큐어, 펜타시큐리티, 신시웨이, 시큐센, 아이넵 등의 기업으로부터 DB 암호화 관련 상용화 사례를 찾을 수 있다. 최근 들어 개인정보 비식별조치 가이드라인에 따라 개인정보의 익명 및 가명 처리에 대한 필요성이 대두되고 있어 이를 효율적으로 실현하기 위한 DB 암호화에 대한 수요는 지속적으로 증가할 것이다. 하지만 DB를 암호화하는 경우 범위 검색 질의에 대한 효율성 문제가 발생한다. 일반적인 개념의 암호화는 평문 또는 메시지(이하, 평문) 사이의 순서가 보존되지 않기 때문이다. 이 문제를 해결하기 위한 방법 중 하나가 순서 보존 암호(Order-Preserving Encryption: OPE)이다. 순서 보존 암호는 평문 사이의 숫자 또는 문자로 나타난 순서가 암호문 사이에도 유지되는 성질을 가지고 있다. 좀 더 자세하게는, 주어진 암호화 알고리즘 E와 임의의 비밀키 k에 대해 두 개의 평문 m1, m2가 m1 > m2를 만족하면 E(k, m1) > E(k, m2)가 성립한다. 따라서 암호화된 DB에 대한 범위 검색 질의를 효율적으로 처리할 수 있다. 이 밖에도 최소 값, 최대값, 카운트, 정렬 등의 질의에도 효율적으로 대응할 수 있다. * 본 내용은 이승광 선임연구원(☎ 042-860-1437, skwang@etri.re.kr)에게 문의하시기 바랍니다. ** 본 내용은 필자의 주관적인 의견이며 IITP의 공식적인 입장이 아님을 밝힙니다. ***2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 작성되었습니다(No.2021-0-00779, HW지원 프라이버시 보장 암호데이터 고속처리 기술 개발). 순서 보존 암호화 기술 연구 동향 Chapter 02 주간기술동향 2021. 9. 15. 18 www.iitp.kr [그림 1]은 순서 보존 암호화가 적용된 연봉 정보에 대해 클라이언트가 질의한 후 응답을 받는 과정을 보여준다. 클라이언트는 비밀키를 통해 질의할 연봉값의 경계값들을 암호화한 후 암호화된 연봉의 범위에 대한 질의문을 구성한다. DB 서버는 기존 DB의 질의와 동일한 방식으로 해당 조건에 맞는 행들을 찾아 응답하고, 클라이언트는 이를 복호화한다. 본 고에 서는 초기하 분포 기반 샘플링을 이용한 순서 보존 암호 알고리즘을 시작으로 순서 노출 암호에 이르는 연구 동향을 살펴본다. II. 초기하 분포 기반 순서 보존 암호 기술 초기하 분포(hypergeometric distribution)란 비복원 추출을 통해 N개의 샘플 중 y번 추출했을 때, 두 개의 성질(성공/실패, 흰/검 등) 중 한 성질의 샘플이 x개 뽑힐 확률의 분포 이다. [그림 2]를 예로 들면, 총 N개의 흰색과 검정색 공이 들어있는 주머니의 검정색 공의