검색 엔진의 작업

많은 초보 웹 마스터와 인터넷 서핑 팬은 질문 : 검색 엔진이 어떻게 작동합니까? 검색 엔진의 기본 원리 오늘은 자문위원회 (Country of Councils)를 고려할 것입니다.

현대 검색 엔진은 놀라운 복잡한 속도와 함께 작동하는 가장 복잡한 프로그램과 알고리즘으로 구성된 전체 복합체입니다. 상상해보십시오, 새로운 검색 알고리즘 Google의 카페인은 불과 1 초 만에 3km의 A4 용지에 해당하는 정보를 처리 할 수 있습니다.

모든 검색 엔진에서 소프트웨어 구성 요소는 5 개의 주요 그룹으로 나눌 수 있습니다.

"거미"

"여행하는 거미"

인덱서

데이터베이스

결과 시스템

거미 - 스파이더 (스파이더) - 브라우저의 알고리즘과 비슷하지만 시각적 구성 요소가 없습니다. 스파이더는 http 프로토콜을 사용하여 페이지의 html 코드를로드합니다.

서버에 대한 로봇 요청은 명령"Get / path / document"및 기타 http 요청 명령. 이 요청에 대해 스파이더는 서버와 문서에 대한 서비스 정보가 포함 된 텍스트 스트림으로 응답을받습니다. 스파이더는 검색 엔진 색인 생성 모듈의 일부입니다.

"여행 스파이더" - 크롤러 - 다른 구성 요소입니다.색인 생성 모듈. 크롤러는 페이지에서 거미가 찾은 모든 하이퍼 링크를 자동으로 탐색하여 검색 엔진에 아직 알려지지 않은 문서를 검색합니다.

로봇 - 인덱서 (인덱서)는 거미 로봇에 의해로드 된 페이지의 내용과 직접 작동합니다. 인덱서는 페이지의 형태 학적, 어휘 분석을 수행하여 페이지를 분리합니다.

데이터베이스 (데이터베이스)는 구성 요소별로 수집 및 인덱싱 된 인덱싱 된 문서를 저장하도록 설계된 특수 소프트웨어입니다.

검색 엔진 결과 엔진 - 결과를 발표하는 시스템이 가장 중요합니다.검색 엔진의 구성 요소. 최종 사용자가 처리하고있는 출력 시스템과 함께 검색 문자열에 쿼리를 입력합니다. 200 가지가 넘는 다른 기준을 바탕으로 결과를 출력하는 시스템은 검색 목표를 가장 만족시키는 결과를 선택합니다.

이러한 선택 알고리즘은 대개 알고리즘 또는 순위 매김. 발급 결과에 영향을 미치기 위해 웹 마스터의 사기를 피하기 위해 정확한 순위 알고리즘 검색 엔진은 가장 엄격한 비밀로 유지됩니다.

그럼에도 불구하고 웹 마스터가 검색 결과에 "합법적으로"영향을 미칠 수 있도록 검색 엔진의 작업에서 고려되는 많은 알려진 기준이 있습니다. 예를 들어, 페이지를 분석 할 때 검색 엔진이 고려합니다.:

페이지 제목에 키워드가 있는지 여부 (제목)

키워드가 페이지의 URL에 표시됩니까?

헤더 (H1-H6), 키워드 (STRONG, B, EM, I)에 키워드가 있는지 여부

페이지의 키워드 밀도 (밀도)는 얼마입니까?

키워드가 메타 태그에 존재합니까 : 키워드, 설명

페이지에 내부 및 외부 링크가 있습니까?

사용자는 검색 서버를 통해 검색 엔진과 상호 작용합니다. 사용자로부터 검색 쿼리 수신서버는 순위 모듈을 처리하여 매개 변수에 입력으로 전달합니다. 차례로, 모듈은 문서의 처리를 수행하고, 정보는 검색 시스템의 데이터베이스에 저장되며, 사용자의 요청에 해당하는 페이지 등급을 부여합니다.

그런 다음 시스템은 사용자에게 SERP (검색 엔진 결과 페이지) 형태로 표시되는 스 니펫 텍스트 정보를 생성합니다. 검색 결과 페이지.

따라서, 메인의 간단한 설명조차도검색 시스템 작업의 원리는 시스템의 모든 소프트웨어 구성 요소가 서로 얼마나 밀접하게 연결되어 있는지, 그리고 검색 엔진이 검색 쿼리에 대해 가장 빠르고 신뢰할 수있는 정보를 제공하기 위해 얼마나 잘 작동하고 명확하게 작동 하는지를 보여줍니다.