All
5 posts
Linearly Mapping from Image to Text Space

EffL LAB. Regular Seminar Linearly Mapping from Image to Text Space (ICLR’23) Problem of Language Model Emily M. Bender and Alexander Koller., “Climbing towards NLU: on meaning form and understanding in the age of data”, ACL 2020 A System exposed only to form in its training cannot in principle learn meaning ##Form & Meaning in Language** Form Anything we can find in a language (e.g., symbols, mouth movements) Meaning Relationship between form and non-linguistic parts Including Communicative…

Information Theory

Information Theory (정보이론) 정보이론의 용어 Information : 정보이론에서는 bit로 측정되며 주어진 이벤트에서 발생하는 “surprise”의 양으로 이해할 수 있다. (defined as the amount of “surprise” arising from a given event) 정보원(Source) : 정보가 발생하는 곳 code : 수신자가 받을 수 있는 모든 벡터를 의미 codeword : 부호어, 코드 중에서 generator를 통해 인코딩된 벡터만을 의미 incoding : 보내고자하는 원래 msg(message) symbols에 식별자(parity check symbol)을 더하는 과정 symbol : k개의 bit를 하나로 모아놓은 단위 bit per second (bps):전송되는 bit의 초당 속도 Entropy : Information의 기대값, 특정한 stochastic process에서 생성된 information의 평균 chan…

Implicit Neural Representations for Image Compression

Implicit Neural Representations for Image Compression Introduction preserves all the information (lossless compression) sacrifices some information for even smaller file sizes (lossy compression) 정보를 모두 보존하는 방향으로의 compression 또는 조금의 정보는 손실이 있어도 파일 크기를 더 줄이는 방향으로의 compression이 존재한다. —> fundamental theoretical limit (Shannon’s entropy) 정보 손실없는 compression이 더 desirable하지만 기본 이론적 한계가 존재한다. 샤넌의 엔트로피는 정보를 표현하는데 필요한 최소 평균 자원량을 말하는데, 샤넌은 아무리 좋은 코드를 설계하더라도 평균 길이가 엔트로피 H(X)보다 짧아질 수 없음을 밝혔다. Therefore, l…

대학원생 때 알면 좋을 것들에 대하여

대학원생 때 알았더라면 좋았을 것들 어떤 연구주제가 나의 호기심과 맞닿아 있지? 관련해선 어떤 연구들이 진행되고 있지? 누가 이 분야를 리딩하는 선구자지? 지금까지 나온 연구의 한계점들이 무엇인지? 한계점 극복을 위해서 내가 기여할 수 있는 부분은 무엇인지? → paper repository를 만들어서 관리 내가 어떤 연구주제를 파고들 수 있을지 알기 위해서 내가 갖고 있는 연구자적 장점 새로 공부한 논문들에서 찾은 연구의 기회를 잘 결합하여 나의 연구 계획을 세워야함 논문의 구조 abstract - 나는 이런 문제를 풀 거야 introduction - 사실 이 문제는 이런 동기에서 연구가 시작된 건데 related works - 관련해서 이런저런 접근들이 있었지 method - 난 이런 새로운 방식으로 접근해보려고 하는데 experiment - 정말 이게 효과적인지 실험도 해봤어 discussion - 실험 결과는 이렇게 해석할 수 있지 conclusion - 마지막으로 너를 위…

Growth Capstone Project

(Growth) Capstone Design Project : Scene Text Recognition 데이터셋 및 모델 구현 문제점 인식 최근 잘못된 번역의 외국어 메뉴판 제공으로 음식 이해도가 낮아지고 있다. 현재 식당마다 일관되지 않은 방법으로 한식 메뉴를 표기하고 있다. 곰탕을 “Bear Soup”, 육회를 “Six times”으로 표기한 잘못된 한식 메뉴의 영문 표기 사례도 최근 논란이 되고 있다. 이렇게 잘못된 번역의 한식 메뉴판 때문에 외국인들은 부정확한 정보를 얻게 된다. 외국인들은 한국 음식을 기억하지 못할 뿐더러 음식의 재료와 맛을 파악하지 못한다는 문제점을 야기한다. 따라서 이러한 문제점에서 착안하여 우리는 캡스톤 디자인 프로젝트 주제로, AI 기반 메뉴판/간판 텍스트 검출 기술(STR; Scene Text Recognition)을 이용한 음식 검색 어플리케이션 개발을 진행하기로 했다. Scene Text Recognition을 위해 선행 공부한 Paper Su…