본문 바로가기
[기록] OCR 변환한 한글을 DB 내 가까운 결과로 반환하기 1. 배경 텍스트를 포함한 이미지(실시간 혹은 사진)에 나온 내용을 DB와 가장 가까운 결과로 반환하고자 한다. 2. 문제 OCR 결과가 이상하게 나오는 경우가 존재 정확하지 않은 문장도 찾을 수 있게 만들고 싶다. 3. 해결 초안 : word2vec을 이용하여 문맥상 가장 가까운 결과 도출 처음에는 한글 단어를 벡터화 하여 거리를 계산하는 방식을 사용하려고 했다. [과정] 이미지에서 OCR을 이용해 텍스트 변환. 특수문자, 영문이 포함된 잘못 나타난 결과를 전처리 (정규식 사용하여 특수문자 제거, 조사와 어미 등은 뒤에 띄어쓰기를 더하여 올바른 형태에 가까운 문장으로 변형.) 한글 단어를 벡터화 하기위해서 kor2vec(https://github.com/naver/kor2vec) 사용하고자 함 훈련이 .. 2023. 12. 7.
잘 알지 못하는 일에 대해 함부로 말하지 말자. 2023. 11. 08 세상에 부러운 일들은 많다. 어느 대기업이 흑자를 내며 돈을 벌고 있다는 기사를 보면서 스크롤을 내렸다. 댓글에는 “결국 돈이 이기네 ㅋㅋ”, “광고 아냐?” 등 비아냥 대는 말 뿐이다. 물론 그런 댓글을 다는 사람이 자신의 신상을 감춘채 이야기 하기에 별 일이 아니라고 생각할 수도 있지만, 나는 최근에 라는 책을 읽으면서 다시 생각하게 되었다. 각각의 깊은 노력들을 이해하고 싶었다. 는 쿠팡의 PO 출신인 작가가 애자일한 방법론으로 일해온 방식을 설명해준 책이었다. 덕분에 간접적으로 쿠팡의 근무 형태와 환경에 대해서 이해해볼 수 있었다. 비상으로 업무를 처리해야 하는 일이라던지, 온라인으로 소통하는 환경에서의 PO의 역할이라던지 말이다. 그래서 쿠팡이 이제 조금은 달리 보였다. .. 2023. 11. 8.
집무실에서 2023. 10. 09 처음으로 집무실을 방문했다. 재밌는 건 여기는 위스키를 비치해놓고 마실 수 있게 되어있다. 지금은 을 읽으면서 잠깐 숨 돌리고 있는 참이었다. 이 책에서는 표준편차를 설명하면서 데이터 분석은 변동의 원인을 찾기 위해 필요하며 변동을 줄이는 방법론을 연구하는 이론이라고 설명한다. 내가 처음 데이터 과학에 관심이 생겼을 때가 생각이 났다. 아무것도 하기 싫을 때, 휴학을 하고 반수를 다짐했었다. 주어진 책임에 최선을 다하지 못하고 도망가려고 한 것 같다는 생각이 든다. 그러고는 집에서 별 것을 다 했다. 생활 패턴은 무너지고 갑자기 백수의 브이로그 그런걸 찍어보기도 하고 영상 편집도 해봤다. 그러면서 느꼈다. 삶이 어떻게 될지 모르는 불안정성은 무서운 것이라고. 무서운 일을 피하기 위.. 2023. 10. 9.
감사한 하루 2023. 10. 3 진정 감사할 줄 모르는 사람은 나였을지 모른다. 나의 노고를 몰라주는 수많은 사람들을 지적하기에 바빴다. 불평 불만이 마르지 않았다. 부정적인 이야기를 하면 할 수록 부정적인 감정에 깊어지는 건 나였다. 어제 애인이 지내는 곳으로 놀러갔다. 지하철을 타고 기차도 타고 택시도 타고 들어가야 도착하는 곳이었다. 가는 길은 썩 즐거웠다. 3시간이 넘는 거리에 나는 문득 그에게 감사함을 느꼈다. 불평을 하는 건 늘 나였다. 나와 놀러 와서는 쉽게 지쳐버리는 그가 미웠다. 저 사람은 왜 저렇게 이기적일까 하기도 했다. 정작 이기적인건 나였다. 그 먼 거리를 거의 매주 1년이 넘게 와준 그가 지쳤다고 탓했다니. 미안하면서 감사해졌다. 늘 내가 더 표현하고 더 많이 쓴다고 착각했다. 그도 나름대.. 2023. 10. 3.
내 감정이 우선입니다 (2023) : 나의 관점에서 정리해보기 1장 지금 기분이 나쁜 건 다 주변 사람들 때문이다? 기분이 좋아야 삶이 즐거워 진다. 지금 기분이 어떤지 묻고 대답해보기 업무를 제외한 모든 상황에서 섣불리 다른사람의 인격이나 기분 상태를 지레짐작하고 판단치 말라 2장 일 잘하는 사람들은 왜 기분이 좋을까? 회사에서 능력자일수록 자신의 기분과 건강 상태를 잘 파악한다 좋은 기분을 회복하는 5가지 스탭 지금 기분이 어떤지 스스로 묻는다 왜 괴로운지 이유를 찾는다 (보통은 타인으로 부터 오는 괴로움은 착각, 고정관념이다.) 왜 계속 착각에 빠졌는지 본질적인 이유를 찾는다. = 착각은 욕구를 채우기 위해 생겨난 것 매슬로우 5대 욕구중 어느것 때문에 발생한 착각인지 생각해보기 만약 이대로 계속 산다면 10년 후에는 어떻게 될지 상상해보기 관점을 바꾼다 다툼.. 2023. 9. 27.
왜 나는 사는게 힘들까? (2023) 2장 같은 행동을 고집하는 사람 집착 기질과 강박성 인격 장애 일에 빠져드는 시기와 피곤에 절어 나가떨어지는 시기가 교대로 일어난다 반드시 조울증이라는 표현을 쓰지 않더라도 모든 일이 술술 잘 풀릴 때, 그리고 피곤이 쌓여서 모든 것이 꽉 막혔을 때가 번갈아 나타나면서 병증이 보인다. 집착기질은 강박성 인격장애에 가깝다 책임감이나 의무감이 강해 ~해야 한다는 자신의 규범이 사로잡힌 상태에서 그것을 유연하게 변경하거나 선뜻 완화하지 못하는 유형이다 융통성이 부족해서 일단 정해진 일이나 규칙은 반드시 지키려고 한다 자신의 장점을 강화하고 단점을 최소화하기 위해서는 우선 스스로가 어떤 특징을 갖고 있는지 파악하는 것이 중요하다. 과거를 돌아보면서 행적을 기록해 보거나 카운슬링과 인지행동치료를 받으면서 수용방식.. 2023. 9. 26.
너무 졸려 2023. 09. 26 너무 졸립다. 정신을 못차리겠다. 근래에는 하루만 늦잠을 자도 일주일이 괴롭다. 일어나 있기가 버겁다. 집에 가고 싶다. 집에 누워서 뉴진스 노래로 만든 재즈 플레이리스트 들으면서 아이스아메리카노 한 잔 하고 싶다. 건강하지 않은 것 같다. 마음도 그렇고 몸도 그렇고 살도 찌고 마음도 여차 하면 시비조로 봐버린다. 다 싫을 때도 있다. 그냥 집에서 혼자 있고 싶다. 고양이가 배 위에 올라와서 꾹꾹이 해주고 엉덩이 두들겨주면 그냥 바로 쓰러져서 골골대는 그런 아침을 보내고 싶다. 날씨에 영향을 많이 받는가보다. 오늘도 비가 오는데 좀 개운치 못하게 미적미적 내리고 있다. 차라리 시원하게 퍼부었으면 나았으려나. 어차피 나가지 못하는건 똑같으니까 똑같이 쳐져있었을까. 비가 오는 날에는 .. 2023. 9. 26.
기획을 발표한 날 2023. 09. 22 역경도 있고 고난도 있기 때문에 인생이 재미있는 것 같다. 어제는 한껏 들뜬 하루였다. 대표님께 기획 내용을 발표하러 갔다. 당연히 긴장되고 어색했지만, 열심히 준비했고 하고 싶은 말도 많아서 오히려 그 긴장이 필요했다. 너무 앞서 나간 불필요한 말을 하는 것도 낭비였고 그렇다고 내가 보여주고 싶은 내용을 하나라도 놓친다면 그것 또한 너무 아쉽게 될 것 같았다. 일면 어떻게 전개 될지 알고 있었던 것 같다. 최선을 다해 준비했으니 분명 좋은 평가를 들을 거란 확신이 있었다. 그래서인지 발표도 자연스럽게 진행했다. 내 인생에서 이렇게 잘 말했던 적이 없던 것만 같았다. 엊그제 친구에게 초등학생들은 도대체 뭘 그리는 걸 좋아할까 던진 질문에 아이디어가 쏟아져 나왔다. 그래서 그 친구에.. 2023. 9. 22.
설득의 심리학 1 - 개정판 (2023) 설득의 무기 누르면 작동한다 : 자동반응 ↔ 통제반응 자동반응을 사용하면 효율적이고 경제적이나, 실수할 확률이 높아짐 인지적 대조원리 무거운 물체를 들고 가벼운 물체를 들면 훨씬 가볍게 느껴짐. 정신물리학 (인지현상과 자극의 물리적 성질과 관계를 조사하는 학문) 상호성 원칙 받은 것은 갚아야 한다. 누군가 부탁할 때 자주 영향을 미침 먼저 호의를 제공하고 보답을 요구 거절 후 양보 전략 : 처음에는 무리한 요구를 하고 거절당하면 이후 작은 요구를 하면 양보처럼 보여 상대 승낙을 받아낼 확률이 높아진다. 악용하는 사람들을 피하는 방법 첫 호의는 선의로 받아들이되 나중에 음흉한 속셈이 드러나면 술책임을 알고 재정의하는 방법을 사용 호감 원칙 신체적 매력 유사성 칭찬 반복적인 접촉과 협력 조건화와 연상작용 나.. 2023. 9. 21.
728x90