DocBook의 활용에 대하여..

닥북 활용에 대한 모든 질문과 답변

DocBook의 활용에 대하여..

전체글글쓴이: iiljiman » 2004-11-28 4:46 pm

DocBook에 입문을 하여 배워가고 있는 중입니다. 몇가지 궁금한 내용이 있어 글을 올립니다.

1. DocBook을 배우면서 현재 지식으로는 워드의 개요 작성 기능을 이용하는 것과 어떤 차이가 있을까 궁금하네요. 출력형태가 다양하다는 이점을 제외하고 문서에 어떤 내용이 들어있는지 찾을 수도 있고, 수백개의 파일로 된 문서에서 내용을 발췌하여 필요한 새로운 문서로 가공을 할 수도 있을 것 같은데 그렇다면 이런점에서 뛰어날 것 같기도 한데.. 이런 기능이 있는지는 아직 배우는 단계여서 모르겠습니다. 구체적인 차이점을 무엇일까요.

2. Tex이라는 것도 얼마전에 문서의 구조화 문제로 접하게 되었는데 TeX이 수식 등을 처리하는데 뛰어나다고 이야기 들었는데 docbook 자료를 보다 보니 MathML이라는 것도 있고 이렇다면 Tex과 DocBook과의 차이도 피부에 와닿는 차이점을 못느끼겠네요.

3. 현재 하는 일이 고문서 번역과 관련된 일을 하고 있습니다. DocBook을 접하면서 공동작업 등에 유용하게 사용할 수 있을 것 같은 가능성을 보았습니다. 그런데 사용하는 코드가 유니코드의 CJK Unified Ideographs Extension A 까지는 지원이 안되는 것 같은데 이러한 기능을 지원을 할 수 있고, CJK Unified Ideographs Extension B 까지도 한자의 범위가 조만간 확대되어서 사용되어야 하는데 이러한 유니코드에서 추가되는 한자들까지도( Extension C가 지금 논의중인 상태)부분까지도 DocBook에서 수용해서 처리될려면 어떤 노력들이 필요한지요. 폰트를 제작한다든지 이런 비용상의 문제가 아닌 다른 기술상의 어려움들이 존재하는지 궁금합니다.

국가에서 고문서를 xml로 작성을 하고 있기는 하나 이것을 실제 연구자들 차원에서는 수많은 문서에서 정보를 뽑아내서 이것을 각자의 연구에 가공을 할 수 있는 필요한 환경이 만들어져 있지 않습니다. 번역을 하면서도 공동작업이 face to face형태로 이루어지고 있는 실정이니깐요. DocBook을 접하면서 이러한 부분에 대한 하나의 해결책을 제시할 수 있을 것 같은데 아직 DocBook에 대해서는 이제 입문하는 단계여서 필요한 내용을 알지 못하여서 질문을 올리게 되었습니다.
iiljiman
 

Re: DocBook의 활용에 대하여..

전체글글쓴이: dyaus » 2004-11-29 7:41 pm

iiljiman 작성:DocBook에 입문을 하여 배워가고 있는 중입니다. 몇가지 궁금한 내용이 있어 글을 올립니다.

1. DocBook을 배우면서 현재 지식으로는 워드의 개요 작성 기능을 이용하는 것과 어떤 차이가 있을까 궁금하네요. 출력형태가 다양하다는 이점을 제외하고 문서에 어떤 내용이 들어있는지 찾을 수도 있고, 수백개의 파일로 된 문서에서 내용을 발췌하여 필요한 새로운 문서로 가공을 할 수도 있을 것 같은데 그렇다면 이런점에서 뛰어날 것 같기도 한데.. 이런 기능이 있는지는 아직 배우는 단계여서 모르겠습니다. 구체적인 차이점을 무엇일까요.

현재 Docbook을 사용해서 여러곳에서 문서화 양식으로 사용하고 있습니다. 강점이라고 하면, 일반적인 워드프로세서보다 시스템 내부에 정리하기 쉽다는 부분이라고 생각합니다. XML 구조에 따라서, 필요한 부분들을 검색하는 것도 가능하고, DB와 연동하는것도 가능합니다.

iiljiman 작성:2. Tex이라는 것도 얼마전에 문서의 구조화 문제로 접하게 되었는데 TeX이 수식 등을 처리하는데 뛰어나다고 이야기 들었는데 docbook 자료를 보다 보니 MathML이라는 것도 있고 이렇다면 Tex과 DocBook과의 차이도 피부에 와닿는 차이점을 못느끼겠네요.

TeX과 Docbook은 Markup을 이용해서, 내용에 집중하기 위한 출판 시스템이라고 생각됩니다. 차이점은 TeX의 경우 그동안 많은 경험들이 축적되어 있고, 아직 Docbook은 이런 부분이 미비합니다. 특히, 한글 지원과 관련된 부분은 많은 개선이 필요한 상황입니다. 두가지 출판 시스템의 진입장벽을 생각해볼때, TeX보다는 Docbook이 조금 낮은 편이 아닌가 생각합니다.

iiljiman 작성:3. 현재 하는 일이 고문서 번역과 관련된 일을 하고 있습니다. DocBook을 접하면서 공동작업 등에 유용하게 사용할 수 있을 것 같은 가능성을 보았습니다. 그런데 사용하는 코드가 유니코드의 CJK Unified Ideographs Extension A 까지는 지원이 안되는 것 같은데 이러한 기능을 지원을 할 수 있고, CJK Unified Ideographs Extension B 까지도 한자의 범위가 조만간 확대되어서 사용되어야 하는데 이러한 유니코드에서 추가되는 한자들까지도( Extension C가 지금 논의중인 상태)부분까지도 DocBook에서 수용해서 처리될려면 어떤 노력들이 필요한지요. 폰트를 제작한다든지 이런 비용상의 문제가 아닌 다른 기술상의 어려움들이 존재하는지 궁금합니다.

국가에서 고문서를 xml로 작성을 하고 있기는 하나 이것을 실제 연구자들 차원에서는 수많은 문서에서 정보를 뽑아내서 이것을 각자의 연구에 가공을 할 수 있는 필요한 환경이 만들어져 있지 않습니다. 번역을 하면서도 공동작업이 face to face형태로 이루어지고 있는 실정이니깐요. DocBook을 접하면서 이러한 부분에 대한 하나의 해결책을 제시할 수 있을 것 같은데 아직 DocBook에 대해서는 이제 입문하는 단계여서 필요한 내용을 알지 못하여서 질문을 올리게 되었습니다.


- CJK Unified Ideographs Extension B를 지원하기 위해서 필요한게 Unicode support 라면, 글꼴문제와 문자 입력기에 관련된 문제가 더 클것으로 봅니다. 현재 docbook의 구조나 이용방법에서는 unicode 지원이 대부분 구현된것으로 알고 있습니다.


조금 두서없는 글이 됐는데, 아직 TeX보다는 부족한 출판시스템이지만, 상호 보완적인 입장에서 공존이 가능할 것으로 기대하고 있습니다.

@ TeX에 관련된 내용은 http://www.ktug.or.kr/ 을 살펴보시면, 도움 얻으실 수 있습니다.
dyaus
사용자
 
전체글: 8
가입일: 2004-01-02 5:22 pm

전체글글쓴이: 류광 » 2004-11-30 12:34 am

dyaus님이 전반적인 사항을 잘 말씀해주셨구요... 제 의견을 좀 추가한다면요.

DocBook의 모든 강점은 두 가지 점에서 나온다고 보는데요. 하나는 보통의 텍스트라는 점이고 또 하나는 XML이라는 점입니다. 그 두가지는 각각 워드와 TeX와의 중요한 차이가 될 것입니다.

보통의 텍스트라는 게 왜 중요한지는 Eric Raymond의 Art of Unix Programming 5 장에 너무나 잘 나와 있습니다... 혹시 못 보셨다면 꼭 한 번 읽어보시길... 저는 김희석 역 정보문화사의 번역서를 봤는데요. 영어 원문은 http://www.faqs.org/docs/artu/textualitychapter.html 에 있습니다. 꼭 프로그래머나 엔지니어가 아니라도 많은 영감을 얻을 수 있을 것입니다.

닥북 문서들은 보통의 텍스트이기 때문에 grep 같은 기존의 여러 텍스트 처리 도구들을 그대로 사용할 수 있고, 또 필터나 파이프 같은 일괄처리 지원 수단들도 그대로 사용할 수 있습니다. 이런 점이 워드로는 불가능한 자동화나 일괄처리를 가능하게 하는 요인일 것입니다.

XML 기반이라는 점은 TeX와의 주된 차이점이 되겠는데요. 닥북은 XML이므로 기존의 수많은 XML 기술들과 도구들을 그대로 적용할 수 있다는 장점이 있습니다.

개인적으로 (La)TeX 파일에서 제가 필요한 정보만을 뽑는 PHP 프로그램을 만들어 본 적이 있는데, 많은 부분을 처음부터 작성해야 했었습니다. 특히 파일을 다룬다거나 개별 텍스트 줄을 파싱하는 등의 저수준 작업들을 직접 구현해야 했었는데 반복 작업이 많았고 실수할 여지도 많았던 것 같습니다(물론 제 프로그래밍 실력의 문제가 컸겠지만요...)

만일 닥북이었다면 아마 XSLT 스크립트를 통해서 좀 더 쉽게 해낼 수 있었을 겁니다.. 물론 XSLT이 배우기 쉬운 언어(?)는 아니지만 충분히 성숙된 기술이고 다른 사람들이 만든 걸 조금 수정해서 적용하는 형태로 활용할 수 있는 여지도 많거든요.

dyaus님 말씀대로 TeX는 PS나 PDF 출력물을 뽑기 위한 환경과 도구들은 대단히 성숙되어 있지만, 만들어져 있는 것 이외의 일을 하고자 한다면 닥북 쪽이 더 접근하기 쉬울 것 같습니다. 그리고 최종 단계에서 닥북 문서를 LaTeX 문서로 변환하는 것도 가능하구요...

통상적인 문서 출력 이외의 닥북 활용 예로 최근 두 가지 사례를 봤는데요. 하나는 기존의 DocBook 문서들에서 필요한 정보만을 추출해서 효과적으로 활용하는 예입니다. PHP의 방대한 매뉴얼에서 함수 정보만을 추출해서 쉽게 조회하는 활용예인데 http://www.phpvolcano.com/articles/manual/index.php 에서 볼 수 있습니다.

또 하나는 문서 생성의 측면인데, 출력물을 만드는 과정에서 닥북 문서가 참조할 예제 프로그램의 출력 결과를 자동적으로 갱신하는 예였습니다. C/C++ 프로그램의 빌드에 주로 쓰이는 make를 활용하는 것이었는데, 안타깝게도 링크를 까먹었네요.. 어딘가 저장해 두었을 텐데... 어쨌든 워드라면 OLE 개체 삽입 같은 걸로 비슷하게 흉내낼 수 있었겠지만 의도 그대로 되지는 않았을 겁니다.
류광
사용자
 
전체글: 434
가입일: 2003-12-27 12:02 am

전체글글쓴이: dyaus » 2004-12-01 12:14 pm

류광 작성:또 하나는 문서 생성의 측면인데, 출력물을 만드는 과정에서 닥북 문서가 참조할 예제 프로그램의 출력 결과를 자동적으로 갱신하는 예였습니다. C/C++ 프로그램의 빌드에 주로 쓰이는 make를 활용하는 것이었는데, 안타깝게도 링크를 까먹었네요.. 어딘가 저장해 두었을 텐데... 어쨌든 워드라면 OLE 개체 삽입 같은 걸로 비슷하게 흉내낼 수 있었겠지만 의도 그대로 되지는 않았을 겁니다.


make, ant를 이용하며 가능할것 같은데요..
대충의 시나리오는 docbook에서 출력물을 만들때, xslt, fop를 사용한다고 하면.
xslt 구동 전에 출력결과를 임시파일(?) 형태로 만들고.
docbook내부에서는 그 파일을 import 하고.
xslt, fop 구동하면 될것 같습니다.

@ make, ant의 매크로 기능이 생각보다 다양하고 강력합니다.
dyaus
사용자
 
전체글: 8
가입일: 2004-01-02 5:22 pm

전체글글쓴이: iiljiman » 2004-12-02 1:34 am

친철히 답변을 주셔서 감사합니다.

알려주신 php와 연동부분도 좋은 도움이 되고요.
진입장벽이라는 말씀을 하셨는데 말씀처럼 진입장벽이 높은 것 같습니다. ^^
docbook을 제대로 쓸려면 공부할 것들이 많네요.
iiljiman
 


다시 돌아감: 질문과 답변

접속 중인 사용자

이 포럼에 접속 중인 사용자: 접속한 회원이 없음 그리고 손님들 6 명

cron