SQLite 2분 소요

SQLite, 미국 의회도서관 공식 보존 포맷이 되다 — 데이터베이스가 '영구 기록'의 표준이 되는 순간

데이터베이스 파일이 박물관 유물처럼 ‘영구 보존’ 대상이 된다면 어떤 기분일까요. 미국 의회도서관(Library of Congress)이 SQLite를 공식 권장 보존 포맷(Recommended Storage Format)으로 추가했다는 소식이 개발자 커뮤니티를 들썩이게 했는데요. CSV, JSON, PDF/A 같은 ‘문서’ 포맷 옆에 데이터베이스 엔진이 나란히 서게 된 건 사실상 처음 있는 일입니다.

의회도서관이 말하는 ‘권장 보존 포맷’이 뭔가요

미국 의회도서관은 매년 디지털 자료를 수십 페타바이트씩 받아들입니다. 그런데 100년 뒤에도 이 파일들을 열 수 있을까요. 이 질문에 답하기 위해 만든 게 바로 Recommended Format Statement입니다.

선정 기준은 까다롭습니다. 포맷 명세가 공개돼 있어야 하고, 특정 벤더에 종속되지 않아야 하며, 광범위하게 채택돼 있어야 하고, 자체 기술(self-documenting)되어야 합니다. 워드(.doc)는 들어가지 못했지만 PDF/A, CSV, FLAC, TIFF 같은 포맷이 들어간 이유죠.

여기에 SQLite가 합류했다는 건 의미가 큽니다. 단순 문서가 아니라 구조화된 데이터를 담는 컨테이너가 처음으로 정식 등재된 사례에 가깝거든요.

왜 하필 SQLite였을까요

SQLite는 1989년에 시작돼 30년 넘게 살아남은 라이브러리입니다. 단일 파일에 모든 데이터를 담고, 외부 의존성이 없으며, 코드는 퍼블릭 도메인입니다. 누구도 라이선스로 발목 잡을 수 없다는 뜻이죠.

그리고 이미 우리 모두가 SQLite를 쓰고 있습니다. 아이폰의 연락처, 안드로이드의 SMS, 크롬의 북마크, 비행기 블랙박스 데이터까지 — 추정치로 전 세계에 1조 개 이상의 활성 SQLite 데이터베이스가 돌아가고 있다고 합니다. 보존 포맷의 첫 번째 조건인 ‘광범위한 채택’을 이보다 더 충족하는 데이터 포맷은 사실상 없습니다.

결정적으로 SQLite 개발팀은 파일 포맷을 2050년까지 하위 호환 유지하겠다고 공식 약속했습니다. 30년 뒤에도 오늘 만든 .sqlite 파일이 그대로 열린다는 보장이 있는 거죠. 의회도서관 입장에서 이만한 안심거리가 없습니다.

데이터베이스가 ‘문서’가 됐다는 의미

이번 결정의 진짜 무게는 여기 있습니다. 그동안 디지털 보존의 관성은 “데이터를 빼서 CSV로 떨궈라"였습니다. 데이터베이스는 휘발성이 강한 ‘시스템’으로 봤기 때문이죠.

그런데 SQLite는 다릅니다. 서버가 필요 없고, 설정도 없고, 그냥 파일 하나입니다. 의회도서관은 결국 이렇게 판단한 셈입니다. 관계와 스키마가 들어 있는 데이터는 관계와 스키마째로 보존하는 게 더 충실하다는 거죠.

엑셀을 CSV로 변환하면 수식이 사라지듯, RDB를 CSV로 떨구면 외래키와 인덱스, 제약 조건이 모두 증발합니다. SQLite 파일로 보존하면 이 모든 맥락이 그대로 남습니다.

개발자 커뮤니티의 반응

해커뉴스를 비롯한 개발자 커뮤니티에서는 “이건 D. Richard Hipp(SQLite 창시자)이 30년간 들인 공의 결실"이라는 평가가 나왔습니다. 의회도서관 같은 보수적인 기관이 움직였다는 건, 이미 정부·연구·과학 분야에서 SQLite를 데이터 교환 포맷으로 쓰는 흐름이 임계점을 넘었다는 신호로도 읽힙니다.

흥미로운 관찰도 있습니다. SQLite는 원래 미 해군 구축함의 미사일 시스템용으로 설계됐다는 사실. 전장에서 살아남도록 만든 데이터베이스가 지금은 인류의 디지털 기억을 100년간 지키는 그릇으로 쓰이게 된 셈입니다.

우리에게 주는 시사점

만약 여러분의 회사가 10년, 20년 뒤에도 열어봐야 할 데이터를 가지고 있다면, 이번 결정은 꽤 실용적인 힌트를 줍니다. 마이너 벤더의 독점 포맷, 클라우드 종속 SaaS의 export 형식 — 이런 곳에 데이터를 잠가두는 것보다 SQLite 파일 하나로 떨궈두는 편이 훨씬 안전한 선택지가 됐다는 뜻이거든요.

데이터베이스가 휘발성 시스템에서 영속성 기록 매체로 격상된 이 순간, 여러분의 데이터는 어디에 어떤 모양으로 보존되고 있나요. 지금 한번 점검해볼 만한 타이밍입니다.

SQLite 디지털 보존 데이터베이스 오픈소스 아카이빙

댓글

    댓글을 불러오는 중...