A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data

Source

Evernote/Inbox/A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data.md

Summary

이 문서는 웹 데이터베이스에서 구조화된 데이터 레코드를 식별하고 추출하는 작업의 중요성과 어려움을 다룹니다. 기존 HTML 기반 추출 방식이 HTML의 지속적인 변화로 인해 한계를 보인다는 점을 지적하며, 시각적 접근 방식의 필요성을 암시합니다.

Key Points

웹 데이터베이스의 성장과 함께 구조화된 데이터 추출이 경쟁 분석 및 비교 쇼핑 등에 필수적임
동적 웹 페이지의 복잡한 구조와 관련 없는 정보로 인해 추출 작업이 어려움
기존 HTML 의존적 솔루션은 HTML의 진화에 따라 기능 상실 위험이 있음

웹 데이터베이스 검색 결과 자동 주석 처리 (Automatic Annotation of Web Database Search Results)
DOM 구조 지식 기반 모델을 이용한 반구조화 웹 레코드 강건한 탐지
HTML is the Web ~ Pete Lambert
웹사이트 구조 개선을 통한 사용자 탐색 효율화
HTML 자동 테이블 레이아웃 알고리즘
웹 페이지의 시각적 복잡성 측정 (Measuring the Visual Complexities of Web Pages)
Patch-Based Image Warping for Content-Aware Retargeting
웹의 미래는 컨텍스트(Context)에 있다
When Amazon Meets Google: Product Visualization by Exploring Multiple Web Sources
Profile-Based Summarisation for Web Site Navigation
온라인 탐색 난이도 설명을 위한 상호작용 데이터 활용
Stephen Wolfram 의 .data 최상위 도메인(TLD) 제안
Web browsing behavior analysis and interactive hypervideo
Web Service Compositions with Fuzzy Preferences: A Graded Dominance Relationship-Based Approach
X-Class: XML 문서 구조 기반 연관 분류
감성 분석 중심 웹 크롤링 (Sentiment-Focused Web Crawling)
검색 결과 페이지의 해적들 (Pirates of the search results page)
NautiLOD: 연결된 데이터 웹을 위한 형식적 탐색 언어
Form-Based Web Service Composition for Domain Experts
The Semantic Web and End Users: What’s Wrong and How to Fix It
Social-Sensed Image Search
Ontology-Based Query Answering with Group Preferences
진단 검색에서의 캡션과 편향
훈련 레이블 정제를 통한 텍스트 분류 정확도 향상
Semantic content-based recommendation of software services using context
iHerb ‘milk’ 검색 결과 페이지 스크랩
Browse-to-Search: 시각적 엔티티를 활용한 탐색적 검색
웹상 어린이의 검색 및 브라우징 행동 분석
Statistical Approaches to Concept-Level Sentiment Analysis
고객 리뷰에서 제품 특징 및 의견 추출 방법론
Deep Web 소스의 관련성 및 신뢰도 평가 (Inter-source Agreement 기반)
웹 검색 쿼리의 감정 분석 및 활용
온톨로지 작성에서의 위키 협업 기능 평가
웹 검색의 내재적 다양성(Intrinsic Diversity)과 전체 세션 관련성
색상이 전환율에 미치는 영향 (인포그래픽)
카카오톡 이모티콘을 통한 남녀 감정 분석 (2013)
스페인어 온라인 비디오의 다중모달 감정 분석
Semantic contextual advertising based on the open directory project
Knotch: 색상을 통한 감정 온도계
검색 엔진 쿼리 로그를 통한 사용자 작업(Task) 발견
vlHMM 기반 컨텍스트 인식 검색
Kinect 기반 고객 쇼핑 행동 분석 도구
이미지 출처 검색 도구 목록
대규모 이질적 멀티미디어 데이터에 대한 정서 컴퓨팅(Affective Computing) 서베이
온라인 리뷰 요약: Starlet 접근법
딥웹과 다크웹 탐색 및 검색 엔진 개요
MOWL: 웹 기반 멀티미디어 애플리케이션을 위한 온톨로지 표현 언어
Exploratory OLAP을 위한 시맨틱 웹 기술 활용: 서베이
CPCDN: Context 및 User Intelligence 기반 콘텐츠 전달
웹 검색 행동의 시간적 동역학: 학습, 모델링 및 예측
URL 기반 웹 페이지 언어 분류 기술 종합 연구
UsageQoS: 온라인 사용자 커뮤니티를 통한 웹 서비스 QoS 추정
Small-Document Approaches to Resource Selection 분석
2017 학술 컨퍼런스 포스터 세션 및 연구 아이디어 메모
구글 이미지 검색 또는 바코드 인식을 이용한 서적 정보 관리 시스템
인간 행동 인식용 온톨로지 조사
Who, Where, When, and What: A Nonparametric Bayesian Approach to Context-aware Recommendation and Search for Twitter Users
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
피드백 세션을 통한 사용자 검색 목표 추론 알고리즘
구글의 대화형 검색 (2013)
Typeform: 크로스 디바이스 설문조사 플랫폼
Task Trail: 사용자 검색 행동의 효과적인 세분화
이미지 기반 추천 시스템에서의 정서적 라벨링 (Affective Labeling)
Feature Diagram Languages 에서의 관심사 분리: 체계적 문헌 고찰
Circle & Search: 속성 기반 신발 검색 시스템
검색 엔진 순위 개선: 신화와 현실 (Myths and Reality)
Semantic Queries by Example
웹 엔티티 발견을 위한 병렬 경로 프레임워크 (The Parallel Path Framework)
트위터의 구조적 차이와 시간성이 검색 효과성에 미치는 영향
비디오 검색 결과의 의미론적 계층 구조화
적응형 온톨로지 규칙을 이용한 보상-처벌 기반 개념 탐지
URL 쿼리 문자열을 통한 개인정보 유출 측정 연구
디지털 네이티브 세대와 웹툰을 통한 전자문서 분석
All Smiles: 얼굴 표정 분석을 통한 자동 사진 보정
온라인 건강 검색의 콘텐츠 편향성
웹 애플리케이션 모델 저장소의 텍스트 및 내용 기반 검색
Second Chance: 검색 엔진의 하이브리드 결과 캐싱 및 프리페칭 접근법
Entity Linking with a Knowledge Base: Issues, Techniques, and Solutions
지향적 엔티티-관계 기반 1차 확률 언어(FOPL) 조사
Classification of Homogeneous Data With Large Alphabets
XML 데이터에 대한 키워드 쿼리의 컨텍스트 기반 다양화
Meta-Learning 기반 Instance Selection을 위한 복잡도 측정 지표
Safari Books Online 의 Google BigQuery 비즈니스 인텔리전스 활용 사례
Google 검색 광고 이미지 확장 기능(Image Extensions) 도입
의미적 궤적 모델링 및 분석 (Semantic Trajectories Modeling and Analysis)
Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information
구글 검색 고급 활용 팁 (HackCollege 인포그래픽)
모바일 검색에서 주의 및 만족도 측정 개선 방안
Enriching Documents with Examples: A Corpus Mining Approach
규칙 기반 엔티티 해결 (Rule-Based Entity Resolution)
Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence
Facebook Graph Search 의 성공을 위한 과제
웹 데이터 서비스 통합 및 쿼리 위한 하향식 지식 기반 접근법

AncomWiki

탐색기

A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data

A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data

Source

Summary

Key Points

그래프 뷰

목차

백링크

AncomWiki

탐색기

A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data

A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data

Source

Summary

Key Points

Related

그래프 뷰

목차

백링크