HTML 파싱을 위한 여러 종류의 공개된 라이브러리가 있다.
하지만 jericho Parser만한 라이브러리는 없는 것 같다.

기존에 다른 분께서 안드로이드 전용으로 라이브러리를 수정해서 공유하신 분이 있는데 이 라이브러리는 버전이 3.1 이다. (참고: http://blog.naver.com/zeanz/110092582999)

3.1 버전을 써도 크게 문제 될 것은 없지만, 뭔가 최신 버전을 쓰고 싶은 욕망이 생기기 마련이다.
그래서 JAVA 용 라이브러리를 안드로이드에서도 사용할 수 있도록 약간 수정 해 보았다.

3.3 버전은 2012년 10월 30일에 Release 되었다. 용량은 251KB로 현재 유통(?) 되고 있는 3.1 버전의 226KB 보다는 용량이 크다.
APK 파일 용량에 민감하다면 3.1 버전을 사용하는 것을 추천한다.
3.2 버전도 만들어서 가지고 있는데 용량 차이가 크게 없다. (250KB)

본인 애플리케이션의 사용에는 문제가 없었으나 혹시 문제가 발생할 수도 있다.


라이브러리 다운로드

jericho-android.3.3.jar (257,148 바이트) 


사용 방법 (이클립스)

라이브러리를 추가하는 방법은 여러 가지가 있겠지만, 아래 방법이 제일 간편한 방법인 것 같다.

1. 해당 안드로이드 프로젝트의 최상위 폴더에 libs 폴더를 생성한다.
2. 다운로드 받은 라이브러리를 붙여넣기 한다. {프로젝트명}\libs\jericho-android.3.3.jar
3. 프로젝트를 선택하고 F5 키를 눌러 새로고침한다.
4. 패키지를 import 한다. import net.htmlparser.jericho.*;

Source source = new Source("Parsing 할 주소");
source.fullSequentialParse();
...


참고

Jericho 오픈 소스 프로젝트: http://jericho.htmlparser.net
Jericho API 문서: http://jericho.htmlparser.net/docs/javadoc/


'' 카테고리의 다른 글

Windows 7 에서 기본 폴더명 영문으로 나오는 경우 복구  (0) 2012.11.18

+ Recent posts