티스토리 툴바


1. Boolean retrieval

Studies 2009/07/29 04:42
. Information Retrieval(IR)
 구조화(정리)되지 않은 필요한 정보를 가지고 있는 텍스트로 부터 무언가 소재, 재료로 쓰일 것들을 찾아내는 것
 
. IR에서 요구되는 것
1. 거대한 문서들을 빠르게 처리
2. 좀더 유연한 검색을 지원
3. 랭크를 통해 가장 좋은 결과 지원
 
. Boolean Retrieval Model
term(중요단어)와 그 문서안에 존재 유무를 가지고 Matrix를 만든다
ex)
                 햄릿        오델로         리어왕
      시저        1              0                1
     안토니      0              1                1
클레오파트라  1              1                1
 
만약 시저 and 안토리의 쿼리가 들어오면
101 and 011 의 연산으로 001, 즉 리어왕이 해당한다.
BUT, 이렇게 만들면 극도로 sparse한 Matrix가 되므로 공간낭비
 
 
. Inverted Index
dictionary(중요단어)와 documentID(posting)를 조합해 리스트를 만든다.
ex)            
     시저         -> 1 -> 2 -> 4 -> 11 -> 31 -> 45
    안토니       -> 1 -> 2 -> 4 -> 5 -> 6
클레어파트라  -> 2 -> 31 -> 54
 dictionary                           posting
 
dictionary : 알파벳순서대로 정리, 문서에서 해당 단어가 발견되는 데로 리스트에 문서ID를 추가
posting : 문서마다 부여된 특정ID
 
inverted index를 만드는 순서
1. DocID들을 모은다
2. Tokenize를 한다.
3. 언어적 처리를 한다(조사를 제거, 대명사 제거 등)
4. 인덱싱을 한다.
 
인덱싱하면서 frequecy를 따져서 그 단어의 중요성을 파악할수 있다.
 
시저&안토니, 안토니|클레오파트라 등의 boolean연산을 할때는
각각의 인텍스 리스트들을 연산하여 새로운 리스트를 임시 생성하여 처리한다.
 
저작자 표시 비영리 변경 금지
Posted by s24731

제목 : 가슴 두근거리는 삶을 살아라 
저자 : 마이크 맥매너스 
출판사 : 시대의 창
 
내 인생에서 최고의 책을 추천해 달라고 하면 나는 당당히 이 책을 추천해 줄것이다.
인생을 사는 방향을 정하는 방법을 알려주는 책..
정말 내 가슴을 두근거리게 하는 일들이 무엇인가?
나는 그런 일들을 하면서 정말 효율적으로 살고 있는가,
아니면 애써 싫어 하는 일들을 하면서 짜증내며 살고 있는자..
정말 인생은 짧다..
내 가슴을 뜨겁게 하는 일들만 하면서 보내도 부족한 인생이다..
 
% Note %

. 소스(source) = 흥미와 호기심의 원천이며 의욕이 샘솟는 근원지이자, 기적의 샘. - 9페이지
 
. 본래의 모습을 되찾기 위해서는 마치 어린아이처럼 몸과 마음이 흥미와 호기심을 좇아 움직여야 한다. 태어나면서 자연스럽게 갖게 되는 이런 흥미와 호기심을 중심으로 삶의 방식을 설계해 나가면 분명 당신의 소스에 도달할 수 있을 것이다. - 12페이지
 
. 더 이상 하고 싶지않은 일을 하려고 애쓰지 말자 - 15페이지
 
. 우리의 사회는 책임이란 가족과 직장 그리고 사회에서 기대하는 대로 행동하는 것이라고 가르치면서 어떤 행동이 사회적으로 환영받는 행동인지, 어떤 직업이 바람직한지를 엄중하게 지시한다. 세상이 커다란 가이드 라인을 제시하면 대부분의 사람들이 그대로 믿고 받아들이는 것이다. - 50페이지

. 사람에게 있어 최고의 책임은 자신의 소망과 욕구를 충실히 이행하면서 사는 것이다. - 54페이지

 
. 창조적인 행위(기분좋은, 생기 있는, 만족하는..)에는 불가사의한  힘이 있어 그런 활동을 하면 자신과 주위 사람들에게도 기적과도 같은 일이 일어난다. - 65페이지
 
. 적성은 크게 문제가 되지 않는다. 중요한 것은 오직 하나, 자신의 가슴을 두근거리게 하고 열중하게 하고 행복감을 안겨주는 일에 외곬으로 파고드는 것이다. 그러면 그 밖의 문제들은 자연히 해결된다. - 67페이지
 
. 가장 좋아하는 일을 하면 저절로 의욕이 생겨 점점 잘할 수 있게 된다. 그리고 스스로 만족해하며 행복을 느낄 때 주위에는 사람과 기회 그리고 돈이 자연스럽게 따라온다. 물론 그렇게 될 때까지는 조금 시간이 걸린다. 당장은 전업할 수 없을지도 모른다. 조금씩 가능한 범위에서 시작하지 않으면 안 되며 수입도 처음에는 충분하지 않을지도 모른다. - 75페이지
 
. 결정은 될 수 있으면 천천히 내리는 것이 좋다. - 85페이지
 
. 우리들은 자신이 좋아하는 일을 하려면 뭔가 희생이 뒤따른다고 배웠고 그러한 사고방식에 얽매며 현실에 순응하며 살고 있다. 그러나 자신의 생각대로 인생을 디자인해 보라. 꿈은 모두 이룰 수 있다. 타협은 필요하지 않다. 자신이 갖고 싶은 것을 모두 손에 넣기 위해서는 유연한 사고와 전혀 새로운 사고방식이 필요할 뿐이다. - 92페이지
 
. 하나의 꿈만을 언제나 우선순위로 두면 반드시 인생의 균형이 깨진다. - 95페이지
 
. 개인의 능력과 마찬가지로 현실적인가 아닌가를 결정하는 잣대는 바로 본인의 주관이다 - 101페이지
 
. 하고 싶은 것을 '모두'하며 살 수 있는 그 근본적인 방법은 무엇일까? 가장 중요한 일에 열정을 쏟으며 실생활에서 크고 작은 욕구들을 채워나갈 때 비로소 인간은 행복해질수 있다. - 112페이지
 
. 인생에서 문제는 생기게 마련이란다. 그것을 해결하려고 노력하는건 중요하지만 그렇다고 언제나 문제가 해결되는 건 아닐다. 문제만 해결되면 살고 싶은 대로 살 수 있을 거라 생각해도 그런 날은 영원히 오지 않는단다. 문제나 장애물 같은 건 아랑곳 하지 않고 나는 나 살고 싶은 대로 산다는 태도가 필요해. 문제를 핑계 삼아 하고 싶은 것을 평생 미루면서 살진 마라. - 122페이지

 
. 작더라도 첫 발을 내딛었다면 당신의 목적은 이미 절반쯤 이루어진 셈이다. 이제 돈이나 시간에 얽매이지 말고 꿈을 향해 한 걸음씩 나아가면 된다. - 126페이지
 
. 굳이 직업을 구하려고 애쓰지 말자. 대신 자신의 꿈을 좇으며 당신만의 인생을 만들어 가자. 좋아하는 일에 푹 빠져 지내는 시간을 늘리자. 좋아하는 일과 관련된 장소에서 뜻이 맞는 사람들과 어울리자. 있는 그대로의 자신을 표출하는 사람들과 사귀자. 당신과 공통 관심사를 가진 이들과 많은 시간을 보내자. 자신의 꿈을 실현하는 데 도움이 될 책을 읽자. 자기계발을 위한 강연회나 영화, 세미나 그리고 모임 등에 빠지지 말고 참석하자. 좋아하는 분야를 충분히 즐기자. 그리고 싶게 파고들자. 아무도 해보지 않은 일에 맨처음 도전하고 용기를 내어 행동하자. 그 다음은 모두 '작은 한 걸음'이 이끌어 줄 것이다. - 166페이지
 
. 좋아하는 일 주위를 서성대라. 그러면 좋아하는 일이 당신을 끌어들일 것이다. - 171페이지
 
. 돈이 없다는 이유로 하고 싶은 일을 하지않는 사람의 경우, 나는 그런 사람들의 속마음은 실상 이렇다고 말하고 싶다. '이것이 정말 하고 싶은지 그것도 잘 모르겠다' 아니면 '이건 정말 내가 좋아하는 일이 아니라'라고. - 178페이지
 
. 구체적인 형태에 대한 집착을 버리면 본질에 다가설 수 있고 선택의 폭도 넓어진다. 겉으로 드러난 형태가 아니라 꿈의 본질에 주목하면 당신은 훨씬 쉽게 좋아하는 일을 하며 살 수 있다.-183페이지
 
. 어떤 사물이나 사람이 네게 맞는지를 판단하려면 그것이 현재의 너를 더 나은 사람으로 만들어 줄 수 있는지 생각해 봐야한다. - 197페이지
 
. 주변의 부담을 털어버리고 자신의 꿈을 좇는 사람의 경우, 때에 따라서는 옛 친구와 지인 등을 잃을 수도 있지만 걱정하지 않아도 된다. 그것은 새로운 생활방식에 어울리는 친구가 곧 나타날 것이란 조짐이다. - 227페이지
저작자 표시 비영리 변경 금지
Posted by s24731

웹 2.0 경제학

Books 2009/07/29 04:13

제목 : 웹 2.0 경제학 
저자 : 김국현 
출판사 : 황금부엉이

웹2.0.. 컴퓨터를 전공하는 사람으로써,
이렇게 풍부한 네트웍 환경인 대한민국에 사는 사람으로써,
싸이, 블로그, 다양한 프로슈밍을 하는 사람으로써,
많이 들었으면서도 궁금했던 '웹2.0' 이라는 단어
그것을 명확히 알려주며, 이제 웹2.0 시대에
과연 미래는 어떻게 변화될것인가?
또 미래의 경제는 무엇을 주도로 바뀔 것인가를 알려준다.
내 미래 사업의 아이템 또한 생각 나게 해주었다..
컴퓨터 전공자에겐 정말정말정말정말 강추 책!!

% Summary %

. 컴퓨터라는 만능의 도구와 컴퓨터가 선사한 세 가지 능력(계산, 모방, 가상)은 인간에게 세 가지 다른 세계(현실계, 이상계, 환상계)를 보여주고 있습니다 - p26

 . 웹2.0을 통해 볼 수 있는 이상계의 3대 통념은 '현실의 대안, 소수자의 대두, 기존 질서의 붕괴'로 정리할 수 있습니다 - p29

. 웹2.0의 핵심 = 공유, 참여, 개방 -p32

. 웹2.0의 여섯가지 변화동력 = 롱테일의 법칙, 집단지성(지식in), 3차산업인 이상계, 사용자들이 참여하는 구조, 기술의 재발견(XML), 깔끔한 디스플레이 - p25

. 블로그에서의 '관심'은 축적할 수 있는 일종의 점수이자 랭킹입니다. - p65

. 구글이 만들어 내고 있느는 포털과 닮은 모든 서비스들은 사용자의 욕구를 만족시키는 것이 궁극적인 목적이 아닙니다. 그들이 만들어 내고 있는 것은 자신들의 미래를 구성하고 있는 하나하나의 모듈입니다. 모듈이란 재사용이 가능한, 그리고 그들을 이용하여 다른 무언가를 만들수 있는 일종의 소프트웨어 부품을 말합니다. (API, 구글맵스) - p119

. 이제 기업은 생각을 달리 해야 합니다. 혁신이 일어나는 곳은 전략 기획실이 아닙니다. 공장의 분임조가 아닙니다. 혁신이 일어나는 곳은 바로 '저 밖' 입니다. '저 밖'의 그들(프로슈머)은 디지털의 대중화로 첨단 연구소 수준의 장비를 갖추고, 지식 수준의 제고와 취미의 다변화로 학위가 없어도 박사 수준의 식견을 가지고 있고, 기자가 아니라도 기자 수준의 집필력과 영향력을 지닌 채 혁신을 선도하고 있습니다 - p128

. 이상계에서는 그것이 가능할지 모릅니다. 이상계란 어차피 모든 물리적 법칙이 리셋되는 곳이기 때문입니다. 힘이 들지 않는다는 것은 탈물질화된 이상계의 절대적인 강점입니다. - p147

. 자신이 제공할 가치가 정말 참된 것이라면, 정말 훌륭한 것이라면 이는 반드시 승리할 것입니다. - p151

. 현실계에서는 기업이 '꼭 유용한 상품 정보'라는 희소자원을 장악하고 있었고, 기업은 이 복음을 자랑스럽게 홍보하고 전파했습니다. 그러나 이상계에서는 소비자가 '꼭 내가 하고 싶은 것'이라는 희소자원을 장악하고 있습니다. 즉, 권력이 이동된 것입니다. 소비자는 기업이 뭐라 하든 크게 신경 쓰지 않습니다. 일일이 듣지 않아도 자신이 원하는 것을 얼마든지 찾고 향유할 수 있기 때문입니다. 특히 블로그라는 도구는 그러한 시대의 상징입니다. - p172

. 어텐션이라는 희소자원을 효율적으로재분배하는 방식들 - p180
1. 공평 타당한 검색 : 링크순위 (구글)
2. 평판시스템 : 평가제도 (지마켓, 옥션)
3. 시간축 : 가장 최신 자료 (실시간검색어, 테크노라티)
4. 퍼뮤니케이션 : 펌/스크랩 순위 (첫눈)

. 현재 네이버를 필두로 하는 국산 포털의 패권은 적어도 두 가지의 위협에 노출된 셈입니다. 하나는 구글로 대표되는 '서양 함대' 이고, 또 다른 하나는 웹/게임 네이티브라는 새로운 세대에 의한 팽창되는 '환상계'입니다. - p236

. 시청자들의 관심은 점점 기존의 일방적 매스미디어에서 자신의 관심이 가장 유용하게 소모될 수 있는 쌍방향미디어로 이행해 갑니다. - p252

. 현실기업이 웹2.0 에게서 배워야 할 세가지 : 개인의 중심화, 오픈화, 서비스화 - p313

Posted by s24731