라이프해커 2.0

free yourself from the mess of life

Archive for the ‘Search engine’ tag

인터넷의 미래에 대한 에릭 슈미트의 7가지 관점

5 comments

구글 회장 에릭 슈미트와 구글 아이디어의 창시자 제라드 코헨이 공동집필한 책이며, 올해 4월에 출시 될 예정인 도서  “새로운 디지털 시대: 개인, 국가와 비지니스의 미래를 재편하다.“는 인터넷의 미래에 대한 에릭 슈미트 7가지 관점을 포함하고 있다고  WSJ가 추가로 보도를 했습니다. 그중 주목할 만한 내용은 다음과 같습니다.

vforvendettavforvendett

 

실명제: 일부 정부는 자신의 국가에 추종이 불가능한 수천수만의 익명의 인터넷 사용자가 숨어있다고 가정하고 있으며 이를 위험하다고 생각하고 있습니다. 그들은 모든 온라인 계정을 알려고 하며, 국가 수준의 온라인 실명제를 실시함으로써 가상세계에 대한 철저한 통제권을 장악하려고 할 것입니다.

검색엔진: 실명제를 실시한 후, 검색결과에서 인증된 온라인 프로필과 연결된 정보는 자연스럽게 상단에 배치될 것이며, 대부분의 사용자는 검증을 거치지 않은 콘텐츠보다 좀 더 높은 순위를 차지하고 있는 검색결과를 클릭할 가능성이 높습니다. 익명성을 유지하는 사용자는 자신이 제공하는 콘텐츠의 연관성이 점점 떨어질 수 있다는 것에 대해 대가를 치뤄야 할 수 있습니다.

새 유럽연합(EU)?: 벨라루스, 에리트레아, 짐바브웨, 북한과 같은 인터넷 독재국가들은 새로운 네트워크 연합을 구성하여 인터넷 검열 및 모니터링 방면의 기술 및 책략을 공유할 가능성이 높습니다.

기술업체: Tech 업체는 반드시 몇 년 후의 변화에 구체적으로 대비해야 합니다. 실명제를 시작하게 되면, 기술 회사들은 사용자 정보 유출 및 도용 등 문제에 직면하게 되며, 사용자의 개인정보와 보안 등을 보호하기 위해서라도 더 많은 변호사를 고용해야 할 것입니다. 지적재산권, 특허, 개인정보와 관련된 기타 법률적인 소송은 계속될 것이며, 법률 개혁을 통해서 개선할 수 있는 사항은 별로 많지 않을 것입니다.

사이버 전쟁: 우리는 이미 국가를 주체로 하는 사이버 전쟁의 시대에 살고 있습니다. 우리의 대부분은 일상속에서 그것을 인식하지 못하고 있을 따름입니다.

미디어/언론: 점점 더 많은 뉴스 공유 플랫폼과 콘텐츠 생산자가 미디어/언론에 참여함으로써, 미디어/언론 업무의 중심은 사실을 보도하는데로부터 사실을 증명할 수 있는 증거를 찾는 데로 전환할 것입니다. 아마도 엘리트들은 전문적인 언론기관에 더 의존 것입니다. 왜냐하면 온라인 공유 시스템에 점점 더 많은 저질의 뉴스와 정보가 넘쳐나고 있기 때문일 것입니다.

트위터: 원숭이가 셰익스피어의 작품을 타이핑(출력)할 수있을 지는 몰라도, 트위터는 더 이상 분석(analysis)을 생산할 수 없을 것입니다.

이 글은 G스토리에 처음 포스트되었습니다.

Written by 라이프해커

February 3rd, 2013 at 3:37 pm

Google 검색의 작동 원리

2 comments

Google은 매일 181개 국가의 부동한 사용자로부터 146종의 언어로 된 검색 요청을 매일 10억건이상 처리합니다. 검색 건수가 이렇게 엄청 많음에도 불구하고 Google 검색은 사용자가 원하는 정보를 매우 빨리 찾아내어 관심할 만한 검색 결과를 열거해줍니다. 그렇다면 Google 검색은 어떤 원리로 작동하는 것 일까요?

“안녕하세요, 저의 이름은 Matt Cutts며, Google 품질 그룹에서 엔지니어로 일하고 있습니다. 저는 오늘 여러 분들이 검색을 할 때, 어떤 일들이 벌어지는 지에 대해 얘기하고자 합니다.

Google 검색을 할 때, 사용자는 웹을 직접 검색하는 것이 아니라 Google이 색인한 수억 개의 웹페이지를 저장한 Google의 데이터 베이스를 검색하게 됩니다. 하루에도 수많이 사이트가 새로 탄생하고 기존의 웹페이지도 계속 새 게시물이 늘어나지만 Google은 이러한 웹페이지를 최대한 모두 색인합니다. Google은 스파이더라고 하는 소프트웨어 프로그램을 각 웹사이트에 보내, 웹페이지를 크롤링합니다. 검색엔진 스파이더(Spider, 거미 일명 로봇)는 처음에는 소량의 웹페이지를 색인하고, 그 웹페이지에 포함된 링크를 따라 다른 웹페이지들을 방문하며, 새 웹페이지에서 그들이 가르키는 링크를 따라 또 다른 웹페이지들을 색인합니다. 이런 식으로 반복하여 수십억의 웹페이지의 정보가 수천 대의 구글 컴퓨터에 문서로 저장됩니다.

가령 내가 치타가 달리는 속도가 얼마나 빠른지 알고 싶다면, Google 검색창에 “cheetah running speed ”(치타 달림 속도)를 입력하고 Enter키를 누릅니다.

cheetah_0502이 경우, Google의 소프트웨어는 이러한 검색 조건을 만족시키는 매개 페이지의 색인을 모두 검토하며, 수십만 개의 가능한 검색결과 중에서 관련성이 가장 높은 웹 사이트를 최상위에 배치합니다. 검색 결과 순위를 결정함에 있어서, Google이 검토하는 요소는 약 200여가지가 있으며, 아래는 그 중의 몇 가지 요소입니다.

  • 이 웹페이지는 단어(키워드)를 몇 번 반복하여 포함하는가?
  • 이 단어가 제목, URL에 포함되어 있는가? 직접 연결되어 있는가?
  • 페이지에 키워드의 동의어가 포함 되어 있는가?
  • 이 웹사이트의 품질은 우수한가 아니면 낮은 것인가? 혹은 스팸 사이트인가?  이 웹페이지의 PageRank(페이지 랭크)는 어떠한가?

PageRank는 Google의 창립자인 Larry Page와 Sergey Brin에 의해 개발된 웹페이지의 중요도를 판단하는 알고리즘으로서 나중에 이 기술을 바탕으로 Google 검색 엔진을 개발하고 Google 사를 설립하였습니다. 이 알고리즘은 얼마나 많은 외부 사이트가 해당 웹페이지를 링크하었느냐와 해당 웹페이지에 링크를 건 웹사이트의 품질을 고려하여 웹페이지에 점수를 매깁니다.

위와 같이, Google은 위의 각 요소를 종합 판단하여, 각 페이지에 전반적인 점수를 매겨, 사용자가 검색을 하면 잠깐 시간(0.5초)내에 대해 검색 결과를 내보냅니다. Google의 검색은 완전히 알고리즘에 근거한 자연 검색으로서, 가장 유용하고 공평한 검색 결과를 제공하며, 요금을 받고 인위적으로 웹 사이트의 순위를 업데이트하거나 조작하지 않습니다.

자, 그럼 아까 이야기했던 검색어 “cheetah running speed”의 검색결과 페이지를 살펴 볼까요?

기본 검색 결과에는 웹페이지로 연결되는 제목, URL과 내가 찾으려는 내용이 맞는 지를 결정하는 데 도움이 되는 발췌문이 포함됩니다. 또한 해당 페이지의 가장 최근에 저​​장된 버전 및 사용자가 추가로 시도할 가능성이 높은 관련 검색어가 표시됩니다. 때때로 검색결과 페이지의 오른쪽이나 상단에 광고가 표시될 수도 있습니다.cheetah running speed

Google은 광고주에게 최상의 고객을 찾아주기 위해, 그리고 검색을 하는 사용자가 보고 싶은 광고를 볼 수 있도록 하는 것을 염두에 두고, 일반 검색 결과에 광고를 표시하는데 매우 신중합니다. 원하는 정보를 찾는 데 도움이 되거나 매칭되는 광고를 찾아내지 못한다면 Google은 아예 광고를 게재하지 않습니다. 최종, 사용자는 Google 검색을 통하여, 치타가 최고로 시속 60마일 이상을 달릴 수 있다는 사실을 알게 됩니다.”

원작: How Search Works By Matt Cutts

번역: 라이프해커 2.0

Written by 라이프해커

May 3rd, 2012 at 1:07 am

리퍼러 없이 실지 구글 검색결과 페이지로 바로 이동하려면

2 comments

구글 검색결과 페이지에서 임의의 검색결과 링크를 클릭하면 우선 구글 리퍼러 형식의 긴 링크가 브라우저 주소창에 뜨며, 리퍼러 형식의 링크로부터 실지 검색결과의 url로 전환되는 과정이 있는데 이 과정때문에 웹서핑이 좀 늦어진다. 한국과 같이 초고속 인터넷망을 가지고 있는 나라에서는 약간의 지연도 잘 감지되지 않겠지만 해외에서는 체감속도가 좀 느리다.

위의 문제를 해결하려면, 크롬이나 Firefox와 같은 브라우저에서는 Google Tracking-B-Gone라는 유저 스크립트(user scripts)를 설치한 뒤, 구글 검색결과를 직접 클릭하거나, 새 탭에서 검색결과 주소를 열면 실지 url로 바로 이동할 수 있다.

Written by 라이프해커

December 8th, 2011 at 6:57 am

크롬에서 Google+의 글과 프로필을 직접 검색하는 방법

leave a comment

Google+ 에 올려진 어떤 공개 글이나,  사람(프로필)을 찾으려면 아래의 방법에 따르면 된다. 

크롬 검색창에 chrome://settings/searchEngines 을 입력하고 enter를 누른다. 

아래쪽 ‘기타 검색엔진’ 매뉴로 이동한후 3개의 네모칸에 각각 아래의 내용을 입력하면 된다.

G+ search

구글 크롬 검색창에서 Google+ 특정 포스트 검색하기

  • 첫번 째 네모칸 : Google+Post 
  • 두번 째 네모칸 : post
  • 세번 째 네모칸: {google:baseURL}search?q=site:plus.google.com inurl:posts/* %s   
  • 입력한 내용은 자동으로 저장된다. 그 다음, 새로운 크롬 탭을 열고 주소창에 post+빈칸+검색어를 입력하면 된다. 만약 Google+post 검색을 Make default (미리 준비된 기능)으로 설정하면, 나중에 크롬 주소창에 직접 검색어을 입력하면 된다.

구글 크롬 검색창에서 Google+ 프로필 검색하기

  • 첫번 째 네모칸 : Google+Profile
  • 두번 째 네모칸 : profile
  • 세번 째 네모칸: {google:baseURL}search?q=%s&tbs=prfl:e   
  • 입력한 내용은 자동으로 저장된다. 그 다음, 새로운 크롬 탭을 열고 주소창에 profile+빈칸+검색어를 입력하면 된다. 만약 Google+profile 검색을 Make default (미리 준비된 기능)으로 설정하면, 나중에 크롬 주소창에 직접 검색어을 입력하면 된다. 실지 프로필 검색은 Google+에서도 이미 지원하고 있다.
아래 영문 포스트를 참고해도 된다.

How to Search for Google+ Profiles and Posts Using Chrome’s Search Engine Settings

Written by 라이프해커

August 1st, 2011 at 11:44 am

Google +1 button 버튼 발표, 설치방법과 소개

3 comments

예상대로 TechCrunch는 제일 빠른 시간내에 Google +1 button의 탄생을 보도했다. 구글 +1버튼의 삽입효과는 아래 이미지와 같다. 방문자가 사이트의 구글 +1 버튼(예: TechCrunch)을 클릭하면 구글 검색결과에서 관련 페이지가 추천 웹페이지로 표시된다. 페이스북의 like 버튼과 유사하다고 보면 되며, 구글은 Google +1 버튼을 발표함으로써, Facebook과의 소셜 서비스 대결을 위해 실질적인 한보를 내디뎠다.

Google +1

Google +1 버튼 소개 및 설치방법:  아래의 페이지를 방문하면, 상세한 가이드와 동영상을 볼 수 있다. 고급옵션도 제공하고 있으며, 임의의 웹사이트에 이 버튼을 추가할 수 있다. +1 버튼과 기존의 구글 버즈 버튼은 상호 충돌을 하지 않는다.

http://www.google.com/intl/ko/webmasters/+1/button/

구글 +1 이 구글 검색순위에 영향을 미치는가 ?   정답은 여기에 있다.

Google +1 버튼 API : API 페이지는 이곳에 있다.

WordPress  플러그인 :

http://wordpress.org/extend/plugins/wp-plus-one/

Google +1이란 무엇인가 ?

아시는 독자분들도 한번 복습해주시길 ^^. 아래의 순서대로 따라하시면 Google +1이 무엇인지 바로 이해할 수 있다.

Written by 라이프해커

June 2nd, 2011 at 12:37 pm

내 블로그가 마이크로 블로그라니?!

leave a comment

얼마전 다음 고객센터에서 받았던 이메일의 내용이다.

Email from Daum

위의 메일을 받고 어처구니가 없어서,  소스코드를 봐도 내 블로그가 WordPress 블로그인 것이 뻔하지 않냐고 다음 고객센터에 재확인을 요청하는 회신을 보냈다. 그런데 메일이 두번이나 반송이 되어서, 최종 RSS등록은 포기하기로 마음 먹었다.

나의 몇가지 생각:

  • Daum의 고객서비스는 분명 문제가 있으며, 최선이 아니라, 기본에도 도달하지 못했다. 직원들의 기초교육부터 제대로 시켜야 한다.
  • 서비스에 문제가 있다는 것은 다른 경쟁업체들에게 시장을 빼앗길 수 있다는 뜻이기도 하다.
  • 무슨 검색엔진이 자연검색이 아니고 주동적으로 RSS를 등록해야 하나?  결국은 내가 더 멍청했던 것 같다. 현명한 사람은 분명 Google을 쓰지 않으려나.

Written by 라이프해커

May 15th, 2011 at 8:49 am

구글 검색기능을 개선하기 위한 작은 의견

3 comments

부동한 국가의 구글 검색엔진으로 동일한 검색어인 ‘라이프해커’를 검색해보니 상위 검색결과가 조금씩 틀리게  나온다. 사실 이 글은 구글 코리아(?)에 자동으로 의견을 제공하기 위해서 쓰는 글이다.

Google.com in EnglishGoogle Japan에서의 검색결과:

위의 두 사이트의 검색결과는 실지 거의 비슷하며 현재는 아래처럼 나오는데 모두 구글 웹마스터 도구에서 보여주는 동일한 사이트 링크(Site links)를 보여주고 있다.  과거에 구글 웹마스터 도구를 이용하여 도움이 안되는 사이트 링크를 일부 차단시켰는데 현재의 검색결과를 보니 검색 품질(구글 검색엔진의 사이트에 대한 이해능력)이 제고 되었다.

screen capture 2011-3-26-16-27-4

 

구글 코리아에서의 검색결과 :

www.google.co.kr screen capture 2011-3-26-16-48-43

구글 코리아는 이상하게 사이트 링크를 보여주지 않고 있으며,  사이트 링크 대신 검색결과 페이지 제일 윗쪽에 ‘바로가기’  링크를 일부 보여주고 있는데 내가 보았을 때는 이 링크들이 사이트를 이해하는데 별로 도움이 되지 않는다.

가능하면 구글에서 개선을 해줬으면 하는 바램이다.

Written by 라이프해커

March 26th, 2011 at 5:13 pm

Follower숫자로 임의의 트위터 계정의 대략적인 랭킹을 알려면?

leave a comment

Twitter 기술 당당자인 Pankaj Gupta는 단순한 Follower숫자로 트위터 랭킹을 계산할 수 있는 방정식을 트위터로 공개했다.

방정식: exp(21 – 1.1*log(#followers))

여기서 #follower는 임의의 트위터 계정의 follower숫자를 대표한다.  어떤 트위터 계정이 100만의 follower를 가지고 있다면 그의 랭킹은 Wolfram Alpha의 연산으로 exp(21 – 1.1*log(1000000))=331위로 나온다.

울프럼 알파(Wolfram|Alpha)는 수학연산프로그램인 매스매티카의 개발자인 물리학자 스티븐 울프램이 만든 검색엔진으로서 수퍼컴퓨터를 통한 인공지능을 통해 웹상의 지식을 재구성하여 사용자에게 제공하며 간단한 연산을 직접 수행한다. 미국중부시간 기준으로 2009년 5월 15일 오후 7시에 정식으로 출시되었다.

Via TechCrunch

Written by 라이프해커

January 15th, 2011 at 2:31 pm