[2주차] Ice Breaker app 만들기 (1) 유저의 링크드인 정보를 바탕으로 아이스 브레이크 질문을 생성해주는 페이지 생성 1. Scraping a. 링크드인 정보 샘플 생성 : 테스트 앱이므로 샘플로만 제작 (API 사용시 비용 발생) 1) Proxycurl 사이트 -> Linkedin API 키를 얻을 수 있는 페이지로 접속 https://nubela.co/proxycurl/linkedin Enrich your B2B data with Proxycurl's premium APIs Enrich LinkedIn profiles, get contact information, get venture funding data, and list jobs with Proxycurl's premium data enrichment APIs. nubela.co 2).. 2024. 1. 2. [1주차] 강의 시작 : "Hello World" chain 섹션 1: Introduction - LangChain : 대규모 언어 모델과 애플리케이션의 통합을 간소화하는 SDK. - 강의 목표 : building a real world AI based application - project setup : vscode 사용 - 강의 자료 : https://github.com/emarco177/ice_breaker/tree/main GitHub - emarco177/ice_breaker Contribute to emarco177/ice_breaker development by creating an account on GitHub. github.com 섹션 2: The GIST of LangChain - Get started by with your "Hello Wor.. 2023. 12. 26. TensorFlow Lite를 이용한 기기 내 대규모 언어모델 탑재 실습 git clone keras nlp $ pip install -q git+https://github.com/keras-team/keras-nlp.git@google-io-2023 tensorflow-text==2.12 사전학습된 GPT-2 모델과 글 생성하기 import keras_nlp gpt2_tokenizer = keras_nlp.models.GPT2Tokenizer.from_preset("gpt2_base_en") gpt2_preprocessor = keras_nlp.models.GPT2CausalLMPreprocessor.from_preset( "gpt2_base_en", sequence_length=256, add_end_token=True, ) gpt2_lm = keras_nlp.models.. 2023. 9. 3. Google IO 2023 관련 내용 요약 Machine Learning https://io.google/2023/program/4b9ae421-afec-4c6e-a3ca-dfa1164f7cff/intl/ko/ Keras documentation: KerasCV keras random augmentation 랜덤으로 그림의 수를 증폭하는 방법 (뒤집기, 돌리기, 색변환 등 다양한 방식을 사용) rand_augment = keras_cv.layers.RandAugment(value_range=[0, 255]) plt.figure(figsize = (10, 10)) for i in range(9): ax = plt.subplot(3, 3, i+1) augmented_image = rand_augment(image) plt.imshow(augmente.. 2023. 9. 3. [특허] 인공지능 특허 보호 특허로 보호되는 기술 분류 학습용 데이터 셋 획득 데이터 전처리 방법 딥러닝 모델 구조 설계 학습 방법 선택 하드웨어 설계 딥러닝 응용 학습용 데이터 셋 획득 단순 공개 데이터셋은 특허 보호 불가 데이터 셋 획득 방법에 특이성이 있는 경우에 한하여 특허로 보호받을 수 있음 데이터 전처리 방법 학습용 데이터셋 노이즈 필터링, local minimum에 빠지지 않도록 정규화 수행. 종래 데이터 전처리 방법들을 응용 분야에 적합하게 변형해 사용하는 경우 (진보한 특징이 있으면) 특허 보호 가능 딥러닝 모델 구조 설계 및 학습 방법 특정 모델을 선택해서 학습했다는 내용은 특허로 보호받기 어려움 공개된 모델 구조를 변형하거나, 특정 문제를 해결하기 위해 복수의 모델을 결합하는 등과 같이 모델 구조에 특이성이 인정.. 2023. 8. 28. [NLP] Negative Log Likelihood 1. Likelihood Likelihood = 가능도 = 우도 = 특정 사건들이 일어날 가능성 = 샘플들과 확률분포의 일관된 정도 연속 사건 내에서 특정 확률은 0이다 (예를들면 0~1 값 중 0.001이 나올 확률 = 1/무한대 = 0) → 연속확률 내에서의 지정 가능한 확률 확률분포 내 Likelihood 연속확률 확률 = x1과 x2 사이의 넓이 가능도 = f(x1|θ) * f(x2|θ) = f(x1|μ,σ) * f(x2|μ,σ) 이산확률 확률 = p(x1|θ) * p(x2|θ) 가능도 = p(x1|θ) * p(x2|θ) 2. Log Loss Negative log 함수에 넣어서 변환을 시키면 확률이 1일 때 : -log(1.0) = 0 확률이 0.8일 때 : -log(0.8) = 0.22314 .. 2023. 8. 28. 훈련시 활용한 자원 및 툴 1. CPU vs GPU CPU는 거의 모든 계산을 사용 할 수 있으나, 병렬 컴퓨팅에 적합하지 않음. 순차적인 데이터를 사용하는 경우 유용할 수 있음 GPU는 이미지 생성과 조작을 위한 전자 칩으로 딥러닝에서 병렬 구조를 훈련하는데 빠른 연산이 가능함. 신경망과 같은 복잡한 다차원의 형식에서 학습 적합함. 다만 비싸고, 에너지 소비가 큼. 사용량 확인 함수 (linux) nvitop 사용량 체크 커멘드 라인 함수 어떤 GPU 사용할건지 os.environ["CUDA_VISIBLE_DEVICES"] = 사용하고자 하는 GPU 번호 CPU의 경우 os.environ["CUDA_VISIBLE_DEVICES"]="-1" 2. 모델 훈련 잘되고 있는지 성능 확인은 어디서해요? 훈련하면서 바로바로 시각화 해주는 .. 2023. 8. 28. [Class 101] 협업 필터링 기반 추천 목록 만들기 보호되어 있는 글 입니다. 2023. 8. 27. [Class 101] 룰 베이스 기반 추천 목록 만들기 보호되어 있는 글 입니다. 2023. 8. 27. 이전 1 2 3 4 5 ··· 8 다음 728x90