HTML 파싱을 위한 여러 종류의 공개된 라이브러리가 있다.
하지만 jericho Parser만한 라이브러리는 없는 것 같다.

기존에 다른 분께서 안드로이드 전용으로 라이브러리를 수정해서 공유하신 분이 있는데 이 라이브러리는 버전이 3.1 이다. (참고: http://blog.naver.com/zeanz/110092582999)

3.1 버전을 써도 크게 문제 될 것은 없지만, 뭔가 최신 버전을 쓰고 싶은 욕망이 생기기 마련이다.
그래서 JAVA 용 라이브러리를 안드로이드에서도 사용할 수 있도록 약간 수정 해 보았다.

3.3 버전은 2012년 10월 30일에 Release 되었다. 용량은 251KB로 현재 유통(?) 되고 있는 3.1 버전의 226KB 보다는 용량이 크다.
APK 파일 용량에 민감하다면 3.1 버전을 사용하는 것을 추천한다.
3.2 버전도 만들어서 가지고 있는데 용량 차이가 크게 없다. (250KB)

본인 애플리케이션의 사용에는 문제가 없었으나 혹시 문제가 발생할 수도 있다.


라이브러리 다운로드

jericho-android.3.3.jar (257,148 바이트) 


사용 방법 (이클립스)

라이브러리를 추가하는 방법은 여러 가지가 있겠지만, 아래 방법이 제일 간편한 방법인 것 같다.

1. 해당 안드로이드 프로젝트의 최상위 폴더에 libs 폴더를 생성한다.
2. 다운로드 받은 라이브러리를 붙여넣기 한다. {프로젝트명}\libs\jericho-android.3.3.jar
3. 프로젝트를 선택하고 F5 키를 눌러 새로고침한다.
4. 패키지를 import 한다. import net.htmlparser.jericho.*;

Source source = new Source("Parsing 할 주소");
source.fullSequentialParse();
...


참고

Jericho 오픈 소스 프로젝트: http://jericho.htmlparser.net
Jericho API 문서: http://jericho.htmlparser.net/docs/javadoc/


'' 카테고리의 다른 글

Windows 7 에서 기본 폴더명 영문으로 나오는 경우 복구  (0) 2012.11.18

Windows 7을 사용하다보면 처음에는 폴더명이 원래 한글로 표시되나 어느날 갑자기 영문으로 표시될 경우가 있다.
실제로는 영문 폴더명의 경로가 맞지만 한글 폴더명으로 표시되게 하고 싶을 때가 있다.

C:\Users ('사용자' 로 표시되어야 하나 'Users' 로 표시될 때)
C:\Users\[사용자이름]\Downloads ('다운로드' 로 표시되어야 하나 'Downloads' 로 표시될 때)
C:\Users\[사용자이름]\Documents ('내 문서' 로 표시되어야 하나 'Documents' 로 표시될 때)
C:\Users\[사용자이름]\Desktop ('바탕 화면' 으로 표시되어야 하나 'Desktop' 로 표시될 때)
이하 '내 비디오', '내 사진', '내 음악' 등도 이와 비슷한 경우


방법 1

해당 폴더를 다른 위치로 잘라내기 한 후 원본 폴더에 다시 붙여넣기 한다.
그러나 이 방법으로는 C:\Users 폴더는 이동이 불가능하다.


방법 2 (C:\Users 폴더의 경우)

해당 폴더명을 마우스 우클릭 ▶ 속성 ▶ '사용자 지정' 탭 ▶ '폴더 아이콘' 항목의 '아이콘 변경' 클릭 ▶ '기본값 복원(R)' 클릭 ▶ 확인 ▶ 적용/확인

이 방법을 적용하면 원래대로 폴더 이름이 한글로 돌아오는 것을 확인할 수 있다.



'' 카테고리의 다른 글

안드로이드용 Jericho HTML Parser v3.3  (0) 2012.12.24

아래의 사진은 하이테크 펜 모든 색상이다.

왼쪽 위는 Cosmetic Color + Cutie Color
오른쪽 위는 Soften Color (화장품 색이라고도 함)
아래는 기본 26 색상..

이 외에도 추가 색상이 더 있는데 노란색이다..
노란색은 색깔이 너무 밝아서 보이지 않으므로 사거나 쓰는걸 추천하지 않음

'사진' 카테고리의 다른 글

비 개인 후 서울 한복판의 무지개  (0) 2009.08.18
일식 사진  (0) 2009.07.22

+ Recent posts