논문/논문 리딩3 [논문] Image-based table recognition: data, model, and evaluation / 이미지 기반 테이블 인식 1. 요약문서에서 특정 주제와 관련된 중요한 정보는 종종 표 형식으로 구성되어 있어 독자들이 정보를 검색하고 비교하는 데 도움을 준다. 그러나 이러한 표 형식의 데이터는 자연어로 표현하기 어렵고, PDF나 이미지와 같은 비정형 디지털 문서에서는 구조나 스타일의 다양성으로 인해 머신이 읽을 수 있는 형태로 변환하기 어렵다.이러한 이미지 기반 테이블 인식을 딥러닝으로 해결하기 위해, 우리는 PubTabNet이라는 568,000개의 테이블 이미지와 이에 상응하는 구조화된 HTML 표현을 포함한 공개 데이터셋을 개발 및 공개하였다. PubTabNet은 PubMed Central™ Open Access Subset(PMCOA)에 포함된 과학 논문의 XML 및 PDF 표현을 매칭하여 자동으로 생성되었다.또한 우리는.. 2025. 6. 27. [논문] ReviewChain : Smart contract based review system with multi-blockchain gateway / 리뷰체인 ReviewChain Smart contract based review system with multi-blockchain gateway 1. 요약 리뷰 시스템은 전자 상거래에서 매우 중요한 요소를 가지고 있는 반면에, 중앙 집중식 리뷰 시스템은 조작하는데 매우 간편하다는 단점을 갖고 있다. 그래서 리뷰의 조작을 방지하기 위해 이더리움의 스마트계약을 사용하여 분산 리뷰 시스템을 개발하고 구현합니다. 리뷰 시스템은 2개의 서로 다른 이더리움 기반 블록체인 네트워크를 묶는 메커니즘으로 개발하고 구현할 필요가 있습니다. 하지만, 이더리움 스마트 계약 코드는 제한되어 있어 외부라이브러리를 호출할 수 없는 문제가 있다. 따라서 리뷰 시스템에서는 공증할 수 있는 다중 블록체인 게이트웨이 노드를 도입하였고, 그로 인.. 2019. 7. 28. [논문] The Data Civilizer system / 데이터 시빌라이저 1장 데이터 시빌라이저 구조 Data Civilizer의 개념적인 동작 구조를 그림으로 간단하게 표현했구요. 이 그림은 Data Civilizer논문을 인용했고, 간단하게 설명을 해보도록 하죠. 설명하기 전에 앞으로 Data Civilizer(데이터 시빌라이저)는 한글로 “데이터 시빌라이저”로 칭하도록 할게요. (한국인은 역시 한글을 써야죠) 데이터 시빌라이저는 Online과 Offline 두 영역으로 나누어져 있는 구조를 갖고 있어요. Online영역은 사용자에게 직접 마주하고 있는 검색 모듈(Discovery)가 위치하고 있으며, Offline 영역에서는 시간이 오래걸리는 방대한 양의 데이터를 정리하고, 프로파일링을 통해 링크 그래프로 작성하는 것을 담당하고 있어요. 그림에서 우측에 있는 Workfl.. 2019. 6. 17. 이전 1 다음