본문 바로가기

논문6

[논문] Image-based table recognition: data, model, and evaluation / 이미지 기반 테이블 인식 1. 요약문서에서 특정 주제와 관련된 중요한 정보는 종종 표 형식으로 구성되어 있어 독자들이 정보를 검색하고 비교하는 데 도움을 준다. 그러나 이러한 표 형식의 데이터는 자연어로 표현하기 어렵고, PDF나 이미지와 같은 비정형 디지털 문서에서는 구조나 스타일의 다양성으로 인해 머신이 읽을 수 있는 형태로 변환하기 어렵다.이러한 이미지 기반 테이블 인식을 딥러닝으로 해결하기 위해, 우리는 PubTabNet이라는 568,000개의 테이블 이미지와 이에 상응하는 구조화된 HTML 표현을 포함한 공개 데이터셋을 개발 및 공개하였다. PubTabNet은 PubMed Central™ Open Access Subset(PMCOA)에 포함된 과학 논문의 XML 및 PDF 표현을 매칭하여 자동으로 생성되었다.또한 우리는.. 2025. 6. 27.
[논문 조사/코드분석] 스토리지(STORJ) 코드 분석 - Uplink 최초 작성일 : 2021. 05. 01. 마지막 업데이트일 : 2021. 05. 09. Go 언어는 처음입니다. 그런데 튜토리얼 없이 바로 코드 분석을 하는 스파르타식이라니 ... :( Go 언어는 변수 선언시 데이터 타입을 뒤에, 변수명을 앞에 적는가봅니다. 제가 했던 대부분의 언어는 데이터 타입이 앞에 있어서 코드 보는데 자주 햇갈리네요. 1. root.go 1-1. Function init uplink 모듈을 사용하기 위해, storj에 모듈을 등록하는 부분인 듯합니다만, 정확히 컴파일&빌드할 때 바이너리 파일에 등록을 하는 것인지 ? uplink를 실행할 때 네트워크에 등록을 하는 것인지 추가적인 확인 필요 func init() { defaultConfDir := fpath.ApplicationD.. 2021. 5. 9.
[논문 조사] 스토리지(STORJ) 블록체인 # 출처 https://coinforu.io/coin/board/read/8371/ 1. Storj 홈페이지 : https://storj.io/ About Storj 현재 클라우드형 스토리지는 데이터를 전송하고 저장하기 위해 신뢰할 수있는 제 3 자 역할을하는 대용량 스토리지 공급자에게 거의 독점적으로 의존하게되었습니다.(아마존, 구글, MS) 이러한 시스템은 신뢰 기반 모델의 고유 한 약점으로 인해 어려움을 겪습니다. 클라이언트 측 암호화는 비표준이므로 전통적인 클라우드는 사기업 및 기업 데이터를 노출하는 중간자(man-in-the-middle) 공격, 악성 프로그램 및 응용 프로그램 결함을 비롯한 다양한 보안 위협에 취약합니다. 또한 많은 저장 장치가 동일한 인프라를 사용하기 때문에 파일과 시스템에서.. 2020. 7. 30.
[논문 조사] Gossip Protocol - 소문으로 알게되는 프로토콜 요약 Gossip Protocol 은 제목 그대로 소문으로 알게되는 프로토콜을 의미합니다. A 노드가 새로 알게된 사실을 주변에 있는 B 노드와 C 노드에게 알려주고, B 노드와 C노드는 전달 받은 내용을 듣고 사실인지 확인을 하고 사실이면 인정하고 사실이 아니라면 각 노드가 알게된 사실을 다시 주변 노드에게 알리는 프로토콜입니다. 소문을 통한, 소문에 의한 이 너저분한 그림은 전체적인 플로우를 그리다보니 이렇겝 보이게 되었습니다. 그렇다면 특정 부분만 간추려서 자세하게 살펴보도록 하겠습니다. A 노드가 블로그 100번째 포스트 가 삭제되었다는 사실을 알게되었습니다. 알게된 사실을 주변 노드인 B 노드와 F 노드에게 삭제된 사실을 소문으로 퍼뜨립니다. B 노드와 F 노드는 A 노드에게 들은 소문이 진실인.. 2020. 3. 22.