유저의 링크드인 정보를 바탕으로 아이스 브레이크 질문을 생성해주는 페이지 생성
1. Scraping
a. 링크드인 정보 샘플 생성 : 테스트 앱이므로 샘플로만 제작 (API 사용시 비용 발생)
1) Proxycurl 사이트 -> Linkedin API 키를 얻을 수 있는 페이지로 접속 https://nubela.co/proxycurl/linkedin
Enrich your B2B data with Proxycurl's premium APIs
Enrich LinkedIn profiles, get contact information, get venture funding data, and list jobs with Proxycurl's premium data enrichment APIs.
nubela.co
2) 하단에 API 키를 생성 후 토큰 확인
3) 문서에 작성된 파이썬 코드 혹은 Shell 문법 확인 (복사) https://nubela.co/proxycurl/docs?python#people-api
Complete API documentation for Proxycurl's B2B data enrichment APIs.
nubela.co
4) 파이썬 혹은 Shell에서 실행
import requests
api_key = 'YOUR_API_KEY'
headers = {'Authorization': 'Bearer ' + api_key}
api_endpoint = 'https://nubela.co/proxycurl/api/v2/linkedin'
params = {
'twitter_profile_url': 'https://twitter.com/johnrmarty/',
'facebook_profile_url': 'https://facebook.com/johnrmarty/',
'linkedin_profile_url': 'https://linkedin.com/in/johnrmarty/',
'extra': 'include',
'github_profile_id': 'include',
'facebook_profile_id': 'include',
'twitter_profile_id': 'include',
'personal_contact_number': 'include',
'personal_email': 'include',
'inferred_salary': 'include',
'skills': 'include',
'use_cache': 'if-present',
'fallback_to_cache': 'on-error',
}
response = requests.get(api_endpoint,
params=params,
headers=headers)
5) response 된 결과 json을 파일로 생성 (혹은 github gist로 생성 -> 해당 링크를 request get 해서 데이터 불러올 수 있음)
b. 해당 데이터를 정리하는 함수 작성
import json
def load_linkedin_profile(): # 저장된 샘플 json 불러오기
with open('src/sample.json', 'r') as f:
sample_linkedin = json.load(f)
return sample_linkedin
def scrape_linkedin_profile():#linkedin_profile_url:str): # 정리 후 반환
sample_raw = load_linkedin_profile()
data = {
k: v
for k, v in sample_raw.items()
if v not in ([], "", "", None)
and k not in ["people_also_viewed", "certifications"]
}
if data.get("groups"):
for group_dict in data.get("groups"):
group_dict.pop("profile_pic_url")
return data
2. Agents Theory
Chain of Thought https://arxiv.org/pdf/2201.11903.pdf
3. Tools, AgentType & initialize_agent
- Agent 설정을 위한 파라미터
- Tools : 에이전트가 접근 가능한 도구 (API 등)
- AgentType : https://python.langchain.com/docs/modules/agents/agent_types/
'데이터 어쩌구 > 기술 써보기' 카테고리의 다른 글
이미지 생성 모델 (2024. 02) (0) | 2024.02.27 |
---|---|
[3주차] Ice Breaker app 만들기 (2) (0) | 2024.01.08 |
[1주차] 강의 시작 : "Hello World" chain (0) | 2023.12.26 |
TensorFlow Lite를 이용한 기기 내 대규모 언어모델 탑재 실습 (0) | 2023.09.03 |
[NLP] Negative Log Likelihood (0) | 2023.08.28 |