Root 65

[Part 3] Ch01. Hybrid Recommender System

Hybrid Recommender System 01. Review Contents-based RS Collaborative Filtering 장점 다른 사용자에 의존할 필요가 없다 새로운 아이템을 추천할 수 있다 장점 집단지성을 활용해 평가 품질이 높아진다 잠재적 특징을 활용해 폭넓은 추천이 가능하다 Implicit feedback 활용 가능하다 데이터가 쌓일수록 추천 품질이 올라간다 단점 아이템과 비슷한 분류를 추천할 수밖에 없다 잠재적 의미를 활용하기 어렵다 단점 cold-start 초기 사용자에게 추천이 어렵다 과거 데이터와 큰 데이터에 의존 02. Hybrid? 다양한 데이터와 다양한 알고리즘을 조합하는 방식 → 유저&아이템 프로필, 유저&아이템의 상호관계, 유저의 이웃 정보, 아이템의 이웃 정보..

python - google spread sheet 연결

인스타 크롤링 하다가.. 결과 저장하는 리스트를 바보같이 지역변수로 만들어서 눈물을 훔쳤씁니다.. 스프레드 시트에 연동해 한줄씩 쓸 수 있지 않을까 싶어서 찾아보다 발견해서 공유합니다. Google Spread Sheet 연동 패키지 설치 우선 파이썬에서 gspread, oauth2client를 설치해야 합니다. pip install gspread pip install --upgrade auth2client Google API 사용 구글 개발자 콘솔에 접속합니다. 1. 새로운 프로젝트를 원하는 이름으로 만들어 줍니다. 저는 My First Project라는 언제 만든지 기억도 안나는 프로젝트가 있길래 그걸 사용했습니다. 2. +API 및 서비스 사용 설정을 클릭합니다. 요 아래 화면에서 Google을 검..

Etc./파이썬 2021.08.20

git repository 병합

먼저 github에서 다른 리포지토리들을.. 병합할 새로운 리포지토리를 만듭니다. git bash에서 아래와 같이 하면 됩니다. git clone "리포지토리 주소" cd "리포지토리 이름" git subtree add --prefix="기존 리포지토리 이름" "기존 리포지토리 주소.git" "branch 이름" git push 저는 크롤링한 걸 병합하려고 만들었습니다. 1. github에서 Crawling 리포지토리 새로 생성 2. git bash 켬 3. git clone https://github.com/ChoiRhee/Crawling 4. cd Crawling 5. git subtree add --prefix=Naver_movie_review https://github.com/ChoiRhee/Na..

Etc./네? 2021.08.19

Recommender System [1.2 Goals of Recommender System]

1.2 Goals of Recommender System Recommendation problem이 formulted되는 여러가지 방식 중 가장 유명한 2개는 아래와 같다. 1. Prediction version of problem: 첫번째 접근은 user-item 조합의 평점을 예측하는 것이다. user의 item에 대한 선호도를 나타내는 training data가 있다고 가정한다. m명의 user와 n개의 item에 대해, 불완전한 mxn matrix를 만들 수 있고 여기서 특정 값(지정되거나 관찰된 값)은 training에 사용한다. matrix에서 비어있는 값은 training data로 예측해서 채워 넣는다. 우리는 완전하지 않은, 특정한 값만 채워져 있는 matrix를 가지고 있고 가지고 있는..

Recommender Systems [1.1 Introduction]

1.1 Introduction 추천 시스템의 등장 배경 Web의 중요성이 높아지면서 추천 시스템이 등장하게 됐다. Web을 사용하면서 user들의 피드백을 likes/dislikes로 받을 수 있게 됐다. 예를 들어, 넷플릭스의 user들은 마우스 클릭 한 번을 통해 손쉽게 피드백을 제공할 수 있다. 이 피드백은 ratings를 통해 하는데, user들이 여러가지 item에 대해 직접 별 다섯개 등으로 수치 값을 매기거나 likes/dislikes같이 2가지 중 선택해 클릭하는 방식이 있다. 위의 예시처럼 확실한 피드백 값은 아니지만 Web-centric paradigm에서는 더 쉬운 방법의 피드백을 얻을 수 있다. 예를 들어, 아마존 같은 온라인 쇼핑몰에서 특정한 item을 클릭해보거나 검색해보는 것을..

가장 많이 사용하는 이모지 Top 10

태블로 퍼블릭 갤러리를 구경하다가 아주 귀여운 대시보드를 찾아서 따라해봤습니다. 목차 1. 사용한 데이터 2. 데이터 가져오기 3. 시트 제작 (gif는 클릭해서 봐주세요) 4. 출처, 참고 # 사용한 데이터 시트 제작에 사용한 데이터 설명과 출처입니다. ## 모양 이모지 사진은 이모지피디아 라는 웹사이트에서 가져왔습니다. 애플 버전도 있고 안드로이드, 마이크로 소프트 버전의 여러가지 이모지들을 검색한번 하면 아주 쉽게 다운 받을 수 있습니다! 저는 사진을 다운 받아서 apple_emoji라는 폴더에 만들어 두고 태블로 내에서 모양으로 활용했습니다. 원하는 사진으로 태블로 내의 모양을 설정하려면 "내 PC > 문서 > 내 Tableau 리포지토리 > 모양"의 경로로 들어가서 원하는 모양 set의 이름을 ..

시각화/Tableau 2021.07.24

학생용 Tableau

https://www.tableau.com/ko-kr/academic/students 학생용 Tableau 하나의 제품 키는 최대 두 번까지 활성화할 수 있습니다. 즉, 최대 두 대의 기기에 Tableau를 설치할 수 있습니다. 활성화 허용 횟수를 다 사용한 후 다른 기기에 설치하려면, 활성화한 제품 중 하 www.tableau.com 이 링크에서 본인이 현재 "공인 교육 기관"의 학생임을 인증하면 무료로 1년간 라이센스를 제공받을 수 있습니다. 신분증, 학생증, 성적 증명서, 재학 증명서 등으로 본인 인증을 하면 된다고 하는데, 저는 학생증으로 1시간도 안돼서 인증 바로 받았고 잘 사용 중입니다! 1년간 무료로 사용하고 끝나는 게 아니라 재학생인 상태이면 계속해서 갱신 가능합니다! 저도 언젠가 갱신이 ..

시각화/Tableau 2021.07.22

추천시스템 기본 개념

BOAZ 21-2 방학 스터디로 추천시스템을 공부합니다! 추천시스템 정의 사용자가 사용한 상품을 기반으로 아직 구입하지 않은 상품의 선호도를 추론하여 선호도가 높은 상품을 추천하는 것 Content-based : 상품을 기반으로, 내가 사용한 상품과 비슷한 걸 추천해주는 것 Collaborative : 협업, 나랑 취향이 유사한 다른 user가 좋아했던 걸 기반으로 추천해주는 것 Content-based Filtering 실제로 사용자가 평가했던 상품과 유사한 상품을 추천 UserA가 좋아한 MovieA를 보면 장르가 Love; Romantic인 것을 볼 수 있다. UserA가 좋아한 영화의 장르와 같은 장르인 MovieC를 userA에게 추천해준다. 이처럼 user가 좋아하는 "상품"을 기반으로 추천해..

문자열

# 유용한 함수 txt = 'hello my name is almaeng' ## .index > 문자열에 없는 단어를 검색하면 error txt.index('y') ## find > 문자열에 없는 단어를 겁색하면 -1 출력 txt.index('y') ## 개수 세기 txt.count('m') ## 공백 제거 ### 양쪽 공백만 가능 txt.strip() # 문자열 포매팅 me = 'almaeng' print('hello my name is %s' % 'almaeng') print('hi~ I am {0}, {age} years old'.format('almaeng', age = 23)) print(f'hi hello its {me}')

Etc./파이썬 2021.07.18