Root 65

random seed로 42를 사용하는 이유

머신러닝 딥러닝 책같은 걸 보면 항상 random seed로 42를 쓰는 걸 볼 수 있습니다.. 근데 왜일까요???? 항상 42를 많이 사용한다고만 하고 왜 쓰는지는 책에서 안 알려주더라구요 42가 대체 뭐길래 ~ 42가 어디서 나온 자식이냐면 "은하수를 여행하는 히치하이터를 위한 안내서"에서 나온 자식입니다. 그게 뭐여 ㅋㅋ 할 수 있겠지만 아주 유명한(???) 영화인데요 원작이 소설인가봐요. 은하수 어쩌고에 나오는 슈퍼컴퓨터(이름은 Deep Thought)가 "삶, 우주, 그리고 모든 것에 대한 궁극적인 질문의 해답" 이라는 질문에 대답하기 위해서 750년간 계산을 했다는데.. 그 대답으로 내놓은 결과가 "42"랍니다. 전 42라는 숫자에 엄청난 비밀이 숨겨져 있을 줄 알았는데 딱히 그런 건 아니었네..

Etc./네? 2021.07.18

[보건교사 안은영] 정세랑

드디어 읽었읍니다. 5/19 ! 빨간날에 혜화가서 책구경하다가 사놓고 안읽다가 저번주에 반절 어제 나머지 반절 읽었어요 넷플릭스로 쭉 봤었는데 그거랑 내용이 많이 다르더라구여..? 똑같은건 완전 똑같은데 다른건 완전 달라서 재밌게 봣습니다 ㅎㅎ 저는 책이 더 재미있는 것 같아요! 맨 앞 작가의 말에 안은영이 자기 친구라면서 재밌게 썼다는 이야기가 있었습니다. 여러분 책 볼 때 작가의 말도 읽으면 재밌는 거 알고 계시나요..? ㅎㅎ 담에 함 읽어보세요 ㅋㅋ 보다가 펜트하우스가 있길래 혼자 엇!! 했슴다 ㅋㅋ 어제 본방 앞부분 놓쳐서 슬퍼요 ㅠ 제일 마지막 부분에 나오는 문단~ 저도 용을 실제로 볼 수만 있다면 한번쯤은 보고 싶네유

카테고리 없음 2021.06.19

싸가지에 대해서..

꼰데소릴 거부하는 60대 로맨스 가이 입니다^^ 참고로 전 60대가 아닙니다.^^ "싸가지가 없다" 라는 말이 있습니다. 싸가지가 무엇일까요? 한양도성을 건립할때 인간(人間)이 갖춰야할 덕목(德目)에 따라, 동대문은 '인(仁)'을 일으키는 문이라 해서 흥인지문(興仁之門) 서대문은'의(義)'를 두텁게갈고 닦는문이라해서 돈의문(敦義門) 남대문은 '예(禮)'를 숭상하는 문이라 해서 숭례문(崇禮門)북문은 '지(智)'를 넓히는 문이라 해서 홍지문(弘智門)이라 했습니다. 그리고 그 중심에 가운데를 뜻하는 '신'을 넣어 보(신)각(普信閣)을 건립했습니다 이는 한양도성을 오상(五常) 에 기초하여 건립한 것입니다. 오상이란 인(仁) 의(義) 예(禮) 지(智) 신(信)으로 인간이 갖추고 있는 다섯가지 기본 덕목입니다. 인..

Etc./그냥 2021.05.19

태블로 지도 데이터 만들기 ~

이번에 친구들과 멋진 일을 함께하려고 데이터를 구경했는데요! 지도로 나타내면 좋을 것 같은데 위치 데이터는 없어서 제가 새로 만들어보았답니다. ㅎㅎ 제가 필요한 위치는 [서울, 부산, 대구, 인천, 광주, 대전, 울산, 세종, 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주] 이렇게 있었는데 지도 그릴라고 데이터 찾아보니까 하나도 안나오더라구요.. 그래서 원래 태블로에 있는 superstore sample 데이터 보고 저도 따라서 만들었어요! 슈퍼스토어 데이터가 이렇게 생겨서 저도 따라서 만들었습니다. 제 생각보다 태블로가 똑똑해서 글씨만 넣으면 알아서 인식하더라구여 ~ 근데 도시는 안넣어도 될법 했어요 ㅋㅋ 그리고 대충 도시 column에 서울 서울 서울 이런식으로 쓰고 시/도 랑 국가/..

시각화/Tableau 2021.05.11

펜트하우스 네트워크 대시보드

펜트하우스 네트워크 대시보드 이틀 걸려서 성공했습니다. 하루는 하루종일 네트워크 그래프가 뭔지... 어떻게 만드는지 고민하고 그래프 그릴 계획을 세웠구요.. 하루는 데이터 만들고 실제로 그래프를 그려보았습니다. ㅎㅎ 위비즈의 태블로 퍼블릭에서 기생충 관련한 대시보드를 보고 저도 만들고 싶어져서 만들어봤어요! 세션 때 배우진 않아서 혼자 알아서 공부하느라 오래 걸렸습니다 ㅜㅜ 그래도 똑똑해진 기분이 듭니다 ~ 이게 제가 본 기생충 대시보드에 있는 네트워크 그래프예요! 이런 그래프가 있는지도 몰랐는데 구경하다가 알게 되었씁니다. ㅋ 저도 비슷하게 만들었어요. 제 첫 네트워크 그래프입니다!!! 한글로 된 설명이 검색해도 잘 안 나와서 영어로 찾아봤어요 ㅠㅠ 기생충이랑 완전 똑같은 구성으로 만들었는데 어떤가요?..

시각화/Tableau 2021.04.23

쿠키런 킹덤 대시보드

쿠키런 킹덤 쿠키들 대시보드를 제가 만들었습니다. 저는 월루쟁이에요... 그래서 오전에 아무 일도 안하고 대시보드를 만들었답니다 ^^ 이 포켓몬 scatter plot을 보고 저도 비슷한걸 만들어보고 싶었습니다. 멋있지 않나요?! 필터로 x축 y축을 정할수도 있고 포켓몬 타입별로 따로 볼 수도 있는 데다가 포켓몬 이름을 검색하면 걔가 어디에 위치해 있는지도 볼 수 있어요!!! 저도 그래서 포켓몬으로 하고 싶었지만 저런 데이터를 어디서 얻을 지 모르겠어서 제가 요새 열심히 하고 있는 쿠킹덤 쿠키들로 만들어보았답니다.. ^^ 이렇게 생겼습니다. ㅋ 제가 젤 좋아하는 석류맛 쿠키! 포켓몬처럼 각 쿠키의 유형이랑 등급을 선택할 수 있게 해놨어요. 8개 유형과 3개 등급 중 보고 싶은 애들을 클릭해서 볼 수 있씁..

시각화/Tableau 2021.04.21

5장 RNN

지금까지 본 feed forward 신경망은 시계열 데이터를 잘 다루지 못해서 순환 신경망 RNN이 등장해씀 오른쪽처럼 연결하면 단어의 순서도 고려할 수 있지만 그러면 맥락 크기에 비해 가중치 매개변수도 많이 늘어나서 안좋음 ㅠ > RNN 등장햇습니다 RNN t는 시각. 시계열 데이터 X_t를 입력 받고 h_t 출력 이 식처럼 h_t를 계산하면 위쪽으로 출력되고 동시에 다음 t의 RNN 쪽으로도 출력된다. 현재의 출력값은 이전 t에 기초해 계산되기 때문에 메모리가 있는 계층이라고도 한다! 아니면 은닉 상태 / 은닉 상태 벡터라고도 한다잉 BPTT RNN계층에서 backprop 하는걸 through time 붙여서 BPTT라고 한다. 그치만 그냥 이걸로 학습하면 긴 시계열 데이터에서 계산량이 너무 많아지고..

EfficientNet

Abstract 모델 확장을 체계적으로 연구, 기준 네트워크를 설계한 후 확장 네트워크 깊이, 폭, 해상도의 모든 차원을 균일하게 확장하는 새로운 방법 제안 ImageNet에서 84.3% 정확도, 기존 최고성능 ConvNet보다 8.4배 작고 6.1배 빠름 훨씬 적은 수의 parameter로 최고 정확도 달성! 1. Introduction 체계적이지 않았던 ConvNet 확장! 우리가 효과적으로 확장하는 방법 알려준다 ㅋ 원래는 depth나 width를 확장하는 경우가 많았고 요새는 이미지의 해상도에 따라 모델을 확장하는 경우가 많아지고 있음. 이 3가지 중 한개만 확장하는 게 일반적이고 수동으로 조정해야되는데다가 확장해도 정확도가 개선되지 않는 경우 有 이 논문에서는 ConvNet을 확장하는 걸 다시 ..

CV/논문 2021.04.15

4장 word2vec 속도 개선

여기서 어휘 수가 100만 개가 된다면 입력으로 들어가는 원핫 벡터에 요소가 100만 개이고, 아래 두부분에서 계산이 병목되어 해결해야 한다! 원핫벡터와 W_in 가중치와의 곱에서 → Embedding 계층 도입 은닉층 이후(은닉층과 W_out 가중치의 곱, Softmax 계산) → 네거티브 샘플링 1. Embedding 계층 도입 단어의 분산 표현을 저장 2. 네거티브 샘플링 어휘가 많아져도 계산량을 낮은 수준에서 일정하게 억제할 수 있음 100만 개의 단어 중에서 옳은 단어 1개를 고르는 건 다중 분류! 이걸 이진 분류로 근사하는 게 네거티브 샘플링. 이전까지는 모든 단어에 대한 확률을 계산했지만 이제 "say"라는 단어 하나에만 집중해서 점수 계산하고 sigmoid로 확률로 변환한다. 이진 분류를 ..