본문 바로가기

전체 글

[NLP] Semi-Supervised Formality Style Transfer with Consistency Training (-ing) Informal sentece를 formal text로 스타일을 바꾸어주는 FST (Formality style transfer) 태스크를 위한 연구입니다.데이터셋: GYAFC 베이스모델: HuggingFace Transformers library's implementation of pretrained T5 Large읽은 날짜  2026.06.26카테고리   #Tag1, #Tag2  Semi-Supervised Formality Style Transfer with Consistency TrainingAuthors: Ao Liu, An Wang, Naoaki OkazakiDOI: https://aclanthology.org/2022.acl-long.321/Keywords: Issue Date: May, 2.. 더보기
[NLP] Shakespearizing Modern Language Using Copy-Enriched Sequence to Sequence Models (-ing) 텍스트의 톤앤매너 또는 Writing style을 바꾸는 연구 논문을 찾던 중 발견한 논문으로, modern English를 Shakespearean English (세익스피어 스타일의 영어)로 바꾸어주는 모델 연구에 대한 논문입니다. 데이터셋은 Supervised (parallened dataset) 스타일로, 세익스피어의 original sentence와 그 modern sentence를 준비하였고,2017년에 퍼블리쉬된 오래된 연구다보니 Bidirectional LSTM모델이 사용되었습니다.읽은 날짜  2024.06.26카테고리   #Text_Style_Transformation, #Supervised, #Parallel_data  Shakespearizing Modern Language Using.. 더보기
[데이터 분석] 데이터의 이해 ■  데이터의 유형정성적 데이터: 저장,검색,분석에 많은 비용이 소모 되는 언어, 문자 형태의 데이터정량적 데이터:  정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이  ■  DIKW 피라미드   ■  데이터베이스 특징- Integrated data (통합된 데이터) : 동일한 내용의 데이터가 중복되어 있지 않음.- Stored data (저장된 데이터) : 데이터베이스는 컴퓨터가 접근할 수 있는 저장 매체에 저장되어 있음. - Shared data (공용 데이터) : 여러 사용자가 다른 목적으로 데이터를 공동으로 이용함. 대용량화되고 구조가 복잡함.- Changable data (변화되는 데이터) : 데이터베이스는 새로운 데이터의 삽입, 기존 데이터의 삭제 및 갱신으로 항상 변화하면서도 항상.. 더보기
[데이터 분석] 데이터 분석 전문가 가이드(ADP/ADsP) 내용 정리 (In Progress) 당장 실무에서 실질적인 데이터를 이용해 분석하고 전략을 고안하는 것이 가장 큰 도움이 되겠지만그 전에 이론을 한번 쭉 정리해놓을 필요성을 느꼈다. 어떤 순서로 정리를 할 까 고민하던 중, 데이터 분석 전문가 교재가 많은 내용을 다루고 있고 짜임새 있다고 생각되어데이터 분석 전문가 가이드 교재의 내용을 정리해두고자 한다. 이 페이지는 데이터 분석 전문가 가이드 책의 전체 내용을 요약하거나, 각 개별 과목의 정리된 링크를 모아두는 곳이다.    책 내용 정리- The Guide for Advanced Data Analytics Professional 책 정보 (한국어): https://www.yes24.com/Product/Goods/29430751 목차 1 데이터 이해2 데이터 처리 기술 이해3 데이터 분.. 더보기
[데이터 시각화] The Truthful Art 내용 정리 (In Progress) (진실을 드러내는 데이터 시각화의 과학과 예술) 책 내용 정리- 진실을 드러내는 데이터 시각화의 과학과 예술 책 정보 (한국어): https://product.kyobobook.co.kr/detail/S000001033079책 정보 (영어 원서): https://www.oreilly.com/library/view/the-truthful-art/9780133440492/목차 기초1 우리가 시각화를 논할 때 말하는 것2 훌륭한 시각화의 다섯 가지 조건 진실성3 진실의 연속체4 추측과 불확실성 기능성5 시각화의 기본 원칙들6 간단한 차트로 데이터 탐색하기7 분포 시각화하기8 변화 드러내기9 관계 발견하기10 데이터 맵 만들기11 불확실성과 유의성 실전12 창의성과 혁신에 관하여 서문: 지식의 섬과 경이의 해안     1.  우리가 시각화를 논할 때 말하는 .. 더보기
[HCI] Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models LLM의 능력이 꽤 뛰어나다 보니, 이젠 LLM을 agent라는 존재로 부르는 학계 논문이나 과학 관련 기사가 많이 발견되고 있습니다. LLM 스스로의 메모리 기반으로 계획 및 행동하고, 다양한 스킬(또는 Tool)을 활용할 수 있게 되었는데요, 이런 상황에서 LLM을 general purpose로 사용하는 경우도 있고, 또는 LLM에 퍼소나를 부여하여 그 전문적인 역할을 수행하게 하는 것에 대한 연구가 활발합니다.퍼소나가 부여된 LLM을 조합하여 multi-agent의 상황을 조직하고, 인간의 개입없이 전문가 LLM간의 step-by-step 소통(시뮬레이션)을 통해 문제를 해결하는 것이 가능합니다.이 논문은, Wikipedia와 같은 장문의 기사를 작성하는 과정에서 기사를 쓰기 전 단계(pre-wri.. 더보기
(-ing) [AI + Writing] AI Prompt Storm 사용 방법: URL: https://promptstorm.app/ Prompt Storm - A Powerful Easy to use Artificial Intelligence Prompt Engineering Chrome Software Extension for ChatGPT, Google Prompt Storm chrome extension for ChatGPT, Gemini and Claude Prompt Storm Chrome Extension for ChatGPT, Google's Gemini, and Anthropic's Claude A simple-to-use Google Chrome extension plugin that unlocks all the potential of this revo.. 더보기
(-ing) UrbanComputing: Concepts, Methodologies, and Applications Urban Computing은 도시의 데이터를 활용하여 도시의 문제들을 해결하고 서비스를 제공하기 위한 컴퓨팅 기술을 의미한다. 이 논문은 2014년에 쓰여진 것으로, Urban Computing의 컨셉을 정리하고 주요 연구 과제 영역을 분류 및 제시함으로써 Urban Computing분야의 기본적인 내용들을 정리해 둔 연구 논문이다. 읽은 날짜 2024.02.05 - 카테고리 #UrbanComputing, #DataManagement, #HeterogeneousData UrbanComputing: Concepts, Methodologies, and Applications Authors: Yu Zheng, Licia Capra, Ouri Wolfson, Hai Yang DOI: https://doi-or.. 더보기