본문 바로가기

메끄적

(9)
[검정/시뮬레이션] 메이플 방탄 진 상자 이벤트 지금 겜주님께서 좋은 이벤트를 해주셔서 참여하고 있는데..쉽지않다. 친구가 이거 몇마리 잡아야 끝날까? 라고 물어봐서 갑자기!! 심심해서 돌려보고 싶었다. 일단 계산을 위해서는 표본이 필요하니 먼저 사냥을 했다..(공부를 하기 위해 메이플을 했다?) 대충 친구와 함께 상자를 까면서 통계 확률을 작성해 보았다. 데이터가 이렇게 나왔다. 이제 여기서 드는 의문 1. 친구가 d만 d지게 나온다고 했다.. -> 같은 등급끼리도 빈도가 다르게 나오나? 2. 중급은 대체 언제나오나? 상자를 까도 하만 겁나 나온다. -> 하급/중급 비중 일단 계산을 해보면 중급은 3%, 하급은 97% 정도 된다. 모수가 천개가 넘어서 이정도면 유의미하다고 본다. 1번을 해결하기 위해 카이제곱검정을 수행한다. 8.7, 10.7 정도 ..
마지막 시도 - 신경망 쌓아서 예측해보기 부스팅 알고리즘이 예측이 잘 안되었기 때문에 마지막 지푸라기라도 잡는 심정으로 신경망을 쌓아보기로 했다. 물론 잘 안되겠지만.. 이대로 1주일 노가다 데이터셋을 버릴 수는 없다.(부스팅이 이러한 상황에서는 앵간한 인공신경망모델보다 성능이 비슷하거나 괜찮다고 함) import torch.nn as nn class Model(nn.Module): def __init__(self): super().__init__() self.linear = nn.Linear(12, 12) #self.linear2 = nn.Linear(12, 12) self.linear3 = nn.Linear(12,1) def forward(self, x): res = self.linear(x) #res = self.linear2(res) r..
XGBoost는 어떨까 + 실수로 인한 삽질 어제 아침부터 밤까지 LGBM 학습에서 편이가 생기는 이유에 대해 생각해 보았고 샤타포스를 하고 몇 가지 의견을 내 봤다. 1. LGBM모델은 overfit 가능성이 있기 때문에 사용하지 말고 대신 비슷한 앙상블 기법과 트리를 사용하는 XGBoost 알고리즘을 사용하자. https://datascience.stackexchange.com/questions/40107/can-i-use-xgboost-on-a-dataset-with-1000-rows-for-classification-problem Can I use xgboost on a dataset with 1000 rows for classification problem? I have used all types of classification algor..
일요일 샤타포스 결과 어제 LGBM으로 열심히 삽질하다가 자정에 몬라 조합하고 자버렸다 너무 피곤해서 ㅜㅜ 아침에 일어나서 그동안 스데돌이 7배럭으로 모아놓은 99억 메소를 모두 박을 심산으로 스타포스를 했다 결과는?! 3펑 하고 17->21 5억안에 18->21 간듯 3억 안에 19->20 달성 총...46억 사용(트왈마 3펑까지 포함) 굳 난 절대 22를 트라이하지 않으면 이렇게 이득 보는 장사가 가능하다
LGBM이 잘 작동하지 않은 이유 데이터를 몇 개 누락시키고 만든 모델에서는 추정량이 별로 쓸모가 없는 값이 나온 것을 확인했다 그러므로 갖고 있는 데이터들을 모두 반영해서 한번 학습을 해보겠다. 이러한 데이터중 무기 와 소울옵션 column은 인코딩을 해야한다. 왜냐하면 숫자로 된 벡터 모델에 연산을 할 수 없으니.. 그냥 ESP리미터를 1, 한손둔기를 2.. 이런식으로 라벨링을 할 수는 없다. 왜냐하면 벡터안으로 들어가면 각 변수들간의 dependency를 생각하게 될 텐데 ESP리미터와 한손둔기가 1 2라고 해서 둘이 비슷하다고 볼 수는 없기 때문이다. 그리고 특정 계수에 선형적인 모습을 보일 수 있기 때문에 적절하지 않다. 따라서 자연어처리에서 사용하는 방법을 채용해야 한다. embedding 방식과 one-hot-vector 방..
기계학습 & Data Clearing 연습 - 메이플 데이터로 해보자!! 이번 방학에는 기계학습을 좀 공부해보고 있는데, 재미있는 모델들이 많아서 여러 가지 연습을 해보고 있다. 복수전공으로 배우고 있는 계량경제학 과목에서 금융시계열분석 파트를 공부하면서 시계열자료에 대해 접근하는 방법을 보고, 인공지능을 공부하다 보니 너무 경제 시계열변수에만 초점을 두고 보고있는게 아닌가..싶다는 생각이 들었다. 그래서 이번에는 시계열 분석이 아닌 계량적인 분석에 초점을 맞춰서 데이터를 짜보고 모델을 설계하는 연습을 해보고자 한다. 아직 잘 다뤄보지 않은 도메인이기 때문에 이론적으로 잘 알고 있는 데이터를 기반으로 연습을 하면 데이터셋에 대한 이해도가 높기 때문에 모델 학습을 하기에도 좋다고 생각을 했다. 그래서.. 어떤 데이터가 나에게 익숙한가..? 생각을 해봤는데 마침 그 때 친구가 아..
<메이플> 버닝섭 vs 본섭?! 버닝섭 극한의 이득 보는법 내일부터 버닝서버인가? 하이퍼 버닝때문에 버닝서버를 할 지 안 할지 고민인데.. 이번버닝서버는 안할 것 같고 본섭에서 그냥 천천히 키울 것 같다(계절학기 8학점 + 학부연구생 + 외부 프로젝트 ㅜㅜ) 갑자기 예전에 친구한테 해준 말이 생각이 나서 글로 남겨놓는다. 이번 버닝서버도 시세가 이렇게 될까? 버닝섭을 여러 번 체험 해 봤는데, 대체로 코젬값이 처음에는 200만 메소 정도에 시작되다가 대략 500만 메소 정도로 서버가 끝난다. 원래는 그냥 그런 줄 알고 버닝서버 시작하면 무조건 코젬만 모아서 나중에 팔면 비트코인 못지않은 수익률을 얻을 수 있었다. 아마 이번 버닝서버도 그렇지 않을까 싶다. 다만 거시경제를 공부하고 나서 이러한 현상을 이론적으로 설명할 수 있지 않을까? 하는 의문이 들었고 작년에 ..
<스타포스> 22성까지의 메소 기댓값&파괴횟수 기댓값과 편차에 관해 길드원들은 나를 항상 게이라고 한다. 22성을 도전하지 않기 때문이다. 심지어 22성 한번 도전해본적 있는데 그 바지는 6번 더 터지고 팔아버림. 그 이후로 다시는 하지 않는다. 윈드브레이커이기 때문에 (Destiny 라이브톡 밸패 전) 17앜 21성 둘둘 윈드브레이커 템셋으로 하드루시드는 사실상 불가능에 가까웠다. 그래서 뭐 어떻게든 되겠지~ 하고 해방을 하다가 타이밍이 기가막히게 하드루시드 해방을 해야될 때 상향을 받고 자력으로 끝가지 해방을 했다. 아무튼 요즘은 21성 템으로도 충분히 해방이 가능하고 진듄더도 컨트롤만 좋으면 솔플을 충분히 할 수 있다. 30퍼 아니고 21퍼 27퍼 섞어도 쉽다. 그러므로 직작으로 22성을 가는것은 대가리가 깨진. 여기까지 다만 21성 아이템도 한계가 있다. 스펙업의..