목록DATA (45)
Data Modeling Evangelist Kaien Kim's Blog
데이터 리터러시란 무엇이고, 왜 중요한가요? 데이터 리터러시는 정의하기 어려운 용어입니다. 너무 많은 것을 포함하는 데 사용될 수 있으므로 의미를 잃을 수 있습니다. 모든 것이 데이터와 관련된 경우 이 용어는 별로 도움이 되지 않습니다. 데이터 리터러시를 정의하는 가장 좋은 방법은 리터러시의 정의로 시작한 다음 데이터 세계에 적용하는 것이라고 생각합니다. 일반 리터러시는 내가 더 친숙한 개념이기 때문에 주제를 이해하는 데 도움이 되었습니다. Alberta Education은 문해력을 다음과 같이 정의합니다. "…일상 생활의 모든 측면에서 의미를 획득, 구성 및 전달하기 위해 언어를 사용하는 능력, 자신감 및 의지." [1] 이 기사에서는 "데이터 리터러시란 무엇입니까?"라는 질문에 대한 균형 잡힌 답변을..
Ataccama ONE은 데이터 품질 관리 및 마스터 데이터 관리(MDM)를 위한 종합적인 데이터 관리 플랫폼입니다. Ataccama ONE은 다양한 기능과 유연성을 제공하여 데이터 품질 문제를 해결하는 데 도움이 됩니다. 다음은 Ataccama ONE의 주요 기능, 특징 및 장단점에 대한 설명입니다. 기능: 데이터 프로파일링: 데이터의 누락, 중복, 잘못된 값 등을 식별하고 데이터 품질을 분석합니다. 데이터 표준화: 데이터 값의 일관성을 유지하고 데이터의 형식을 표준화하여 데이터 품질을 향상시킵니다. 데이터 매핑 및 변환: 데이터를 다른 시스템으로 매핑하거나 변환하여 데이터를 일관성 있게 유지합니다. 마스터 데이터 관리: 중복된 데이터를 관리하고 중복을 방지하기 위해 데이터의 일관성을 유지합니다. 데이..
항상 그러하듯이 'Subtyping'에 대해 일단 정의부터 내려보자. Subtyping은 엔터티가 독립성을 유지한 상태로 엔터티 內 공통속성을 그룹화화는 과정이다. 위 정의에는 데이터모델링에 대한(특히 엔터티에 대한) 많은 개념이 들어가 있다. 위 정의를 바탕으로 Subtype/Subtyping에 대해 살펴보자. 엔터티의 독립성1)을 유지한 상태로 엔터티 내 공통속성을 그룹화하는 과정이라고 했는데, 공통속성 그룹화를 하는 이유는(즉, Subtype을 도출하는 이유는) 아래와 같다. - 커뮤니케이션을 향상 시킬 수 있다. - 모델단에서 강제적으로 비즈니스 룰을 적용하여 향후 데이터 정합성을 향상 시킬 수 있다. 간혹, 엔터티 통합/분할의 관점에서 Subtype을 얘기하는 경우가 있는데 맞는 얘기이긴 하지만..
이번에 소개할 내용은 개념 데이터 모델(CDM, Conceptual Data Model)에 속성(Attribute) 도출을 해야하는가? 이다. 사실 필자는 개념 데이터 모델에 속성을 도출하는것을 지양하는 편이다. 이유는 개념 데이터 모델(이하 CDM)의 정의에서 찾을 수 있는데, 개념 데이터 모델의 정의를 먼저 살펴보도록 하자. 개념 데이터 모델(CDM, Conceptual Data Model) : 기호나 텍스트1)로 비즈니스의 개념을 잘 표현한 데이터 모델 즉, CDM으로 비즈니스의 개념을 잘 파악할 수 있어야 하는데, 속성이 도출되어 있을 경우 핵심인 '비즈니스의 개념'보다 해당 속성에 포커싱이 맞추어지는(또는 이슈가 되는) 경우가 생각보다 많이 발생한다는 것이다. 이와 같은 이유로 필자는 가급적 불..
Oracle sequence 구현하기 1. http://roqkffhwk.tistory.com/138 2. Sequence를 테이블로 만들어 관리하기http://www.databaser.net/moniwiki/wiki.php/MS-SQL%EC%97%90%EC%84%9COracle%EC%9D%98Sequence%EB%94%B0%EB%9D%BC%ED%95%98%EA%B8%B0
세계적으로 유명한 데이터 모델러 중 한 사람인 스티브 호버만(Steve Hoberman)이라는 사람이 있다.개인적으로 가장 좋아하는 데이터 모델러이기도 하다. 그의 블로그에는 데이터 모델링의 개념에 대해 여러 사람의 의견을 종합하여 쓴 컬럼을 연재하고 있는데, 그 중 괜찮다고 생각하는 글을 골라 소개하고자 한다. 첫 번째로, 데이터 모델링 관점에서 바라보는 "Thing"에 대해 얘기해보고자 한다.사실 'Thing'에 대해 얘기하기 이전에 'Thing' 이라는 용어(Term) 자체의 의미를 이해하는 것도 쉬운게 아니다. 국내 유명 서적이나 업체에서 이를 '것'으로 번역 하기도 하는데, 필자는 올바른 번역이 아니라 생각한다. 아래는 Naver사전에서 검색한 Thing에대한 내용이다. 무려 10개 이상의 뜻이..
최근 Information Management 스티브 호버만(Steve Hoberman)이 재미있는 글을 하나 올려서 소개합니다. 대충 내용은 ERWin등 모델링 툴에서 부모테이블의 Primary key를 자식테이블에서 Foreign Key로 지정했을때, 부모테이블 컬럼의 definition을 자식테이블에서 - 그대로 사용하느냐? - 마느냐? - 아니면 재정의 하느냐?에 대해 여러 모델러, 아키텍트들의 의견 입니다.보통 모델링을 하면서 이 부분은 크게 문제삼지 않거나, 그냥 넘어가는 경우가 많은데...이 내용으로 3페이지 분량을 다루고 있는게 흥미롭네요^^ 참고로 저는 1) 초기에는 부모테이블의 Key definition을 정의하고, 상속받을 경우 자식테이블의 Foreign key definition을 ..
Data pump로 import 하기 -- 1. User생성create user B2EN identified by 비번; -- 2. 디렉토리 생성-- User와 동일한 디렉토리 생성 후 덤프파일 복사D:\B2EN -- 3. Oracle 디렉토리 설정디렉토리 생성 후 2번 디렉토리와 Mapping -- 4. 생성한 User에 권한 부어grant read,write on directory B2EN to B2EN; grant dba to B2EN; -- 5. 명령창에서 실행impdp B2EN/비번 dumpfile="expdp.B2EN.20131210.dmp" directory=B2EN logfile=a.log
1. 일반적인 경우(초) SELECT ROUND ( MOD ( ( TO_DATE('20120623152300', 'YYYYMMDDHH24MISS') - TO_DATE('20120623152100', 'YYYYMMDDHH24MISS') ), 60 ) * 24 * 60 * 60 ) SEC FROM DUAL; SEC ------ 120 2. NUMTODSINTERVAL() 함수 사용 SELECT TO_NUMBER (SUBSTR (DIFF, 2, 9)) DAY , TO_NUMBER (SUBSTR (DIFF, 12, 2)) HOUR , TO_NUMBER (SUBSTR (DIFF, 15, 2)) MINUTE , TO_NUMBER (SUBSTR (DIFF, 18, 2)) SECOND FROM ( SELECT NUMT..
The Primary Key(PK) constraint is the most basic concept of any RDBMS (I am particularly interested in Oracle). Yet, I have noticed people getting confused when it comes to the practical usage and asking questions like:- I have disabled PK and now oracle is doing full table scan. - How PK constraints and indexes are related/different? - How Oracle is using a non-unique index to enforce PK constr..