목록분류 전체보기 (164)
Data Modeling Evangelist Kaien Kim's Blog
어제 말씀해주신 Oracle(RDS) nologging 사용에 관하여 확인한 내용입니다. RDS Oracle에서 nologging 옵션을 사용하여 오브젝트를 생성할 때, 이중화된 RDS Oracle 인스턴스에 장애가 발생한 경우 복구 간에 영향도에 대해서 확인했습니다. 위에서 확인한 이중화된 RDS Oracle 인스턴스는 Multi-AZ deployments(다중 AZ 배포) 인스턴스이며, Multi-AZ 인스턴스 배포는 RDS가 서로 다른 가용 영역에 대기 복제본을 자동으로 프로비저닝합니다. 데이터는 동기적으로 복제되어 유지되기 때문에 프라이머리 인스턴스에 오류가 발생하였거나, 가용 영역 자체에 중단이 발생하였을 때 failover(장애 조치) 하여 중단이 일어나지 않게 방지할 수 있습니다. Failo..
데이터 리터러시란 무엇이고, 왜 중요한가요? 데이터 리터러시는 정의하기 어려운 용어입니다. 너무 많은 것을 포함하는 데 사용될 수 있으므로 의미를 잃을 수 있습니다. 모든 것이 데이터와 관련된 경우 이 용어는 별로 도움이 되지 않습니다. 데이터 리터러시를 정의하는 가장 좋은 방법은 리터러시의 정의로 시작한 다음 데이터 세계에 적용하는 것이라고 생각합니다. 일반 리터러시는 내가 더 친숙한 개념이기 때문에 주제를 이해하는 데 도움이 되었습니다. Alberta Education은 문해력을 다음과 같이 정의합니다. "…일상 생활의 모든 측면에서 의미를 획득, 구성 및 전달하기 위해 언어를 사용하는 능력, 자신감 및 의지." [1] 이 기사에서는 "데이터 리터러시란 무엇입니까?"라는 질문에 대한 균형 잡힌 답변을..
Ataccama ONE은 데이터 품질 관리 및 마스터 데이터 관리(MDM)를 위한 종합적인 데이터 관리 플랫폼입니다. Ataccama ONE은 다양한 기능과 유연성을 제공하여 데이터 품질 문제를 해결하는 데 도움이 됩니다. 다음은 Ataccama ONE의 주요 기능, 특징 및 장단점에 대한 설명입니다. 기능: 데이터 프로파일링: 데이터의 누락, 중복, 잘못된 값 등을 식별하고 데이터 품질을 분석합니다. 데이터 표준화: 데이터 값의 일관성을 유지하고 데이터의 형식을 표준화하여 데이터 품질을 향상시킵니다. 데이터 매핑 및 변환: 데이터를 다른 시스템으로 매핑하거나 변환하여 데이터를 일관성 있게 유지합니다. 마스터 데이터 관리: 중복된 데이터를 관리하고 중복을 방지하기 위해 데이터의 일관성을 유지합니다. 데이..
저희 첫 째가(만3세) 요즘 식욕 폭발로 몸무게가 5kg을 넘어 다이어트 사료(오리젠 피트&트림)를 먹이고 있었습니다. 이 사료도 물론 아주 잘 먹습니다. 그러던 중 우연히 베스트브리드 홀리스틱 캣다이어트 체험단 모집 공고를 보게되었습니다. 바로 문제의 첫 째가 1살 무렵(중성화 이후) 베스트브리드 그레인프리켓다이어트를 먹였었는데, 처음에는 잘 먹다가 어느순간부터 깨작깨작 먹기시작하여 기호성 좋고 성분좋다던 로우즈로 바꾸고 쭉~먹이다. 체중관계로 오리젠피트&트림으로 먹이고 있는 중이었습니다. 결론 사료를 개봉하는 순간 주변에 와서 계속 관심을 보이다. 식기에 담아주니 숨도쉬지않고 먹었습니다. 한 보름정도 먹이고 있는데 지금도 역시 아주 잘 먹습니다. 이제 얼마 안남았는데 그냥 이 사료로 쭈~욱 먹이려..
어느날 나의 오랜 친구가 한 자전거를 소개시켜줬다. 그 놈을 보자마자 운명처럼 빠져들어버렸고, 미친듯이 미니벨로 장터에서 몰튼을 찾게 되었다. 어느날 마음에 쏙 드는 녀석이 나타났고, 나를 몰튼에 세계로 인도한 그 놈과 대구까지가서 그 녀석을 맞이하러 갔다. 이게 그 녀석과의 첫 만남이었다.
What is AWS Direct Connect? AWS Direct Connect는 고객의 On-premise에서 AWS로 전용 네트워크 연결을 쉽게 구축할 수 있는 클라우드 서비스 솔루션입니다. AWS Direct Connect를 사용하면 AWS와 데이터 센터, 사무실 또는 코로케이션 환경 간에 사설 연결을 설정할 수 있으며, 이를 통해 대부분 네트워크 비용을 줄이고 대역폭 처리량을 높이며 인터넷 기반보다 일관된 네트워크 환경을 제공할 수 있습니다. AWS Direct Connect를 사용하면 네트워크와 AWS Direct Connect 위치 중 하나 사이에 전용 네트워크 연결을 설정할 수 있습니다. 업계 표준 802.1q VLAN을 사용하여 이 전용 연결을 여러 가상 인터페이스로 분할할 수 있습니다..
항상 그러하듯이 'Subtyping'에 대해 일단 정의부터 내려보자. Subtyping은 엔터티가 독립성을 유지한 상태로 엔터티 內 공통속성을 그룹화화는 과정이다. 위 정의에는 데이터모델링에 대한(특히 엔터티에 대한) 많은 개념이 들어가 있다. 위 정의를 바탕으로 Subtype/Subtyping에 대해 살펴보자. 엔터티의 독립성1)을 유지한 상태로 엔터티 내 공통속성을 그룹화하는 과정이라고 했는데, 공통속성 그룹화를 하는 이유는(즉, Subtype을 도출하는 이유는) 아래와 같다. - 커뮤니케이션을 향상 시킬 수 있다. - 모델단에서 강제적으로 비즈니스 룰을 적용하여 향후 데이터 정합성을 향상 시킬 수 있다. 간혹, 엔터티 통합/분할의 관점에서 Subtype을 얘기하는 경우가 있는데 맞는 얘기이긴 하지만..
https://post.naver.com/viewer/postView.nhn?volumeNo=28263000&memberNo=2060019 우린 늘 그렇듯 언젠가 이별하겠지만 [BY 아트인사이트] 노랗고 커다란 눈망울에 홀리면 헤어나올 수 없는 마성의 생명체. 먼 예로부터 불운과... m.post.naver.com 마음 참 따듯해 지는 글이다...
1. Master user사용 2. 싱글 스키마 3. 기본 WLM Queue사용 1. Master user사용 Redshift Cluster를 처음 생성할 때 반드시 Master user를 지정해야하지만, 이 user를 계속 사용하기 보다는 업무별로 사용자를 구분하여 관리하는것이 좋다. 예) ETL, BI, AD-HOC 이유는 사용자 별로 WLM설정 시 대기열을 지정함으로써 효율적인 Queue관리가 가능하기 때문이다. 2. 싱글 스키마 Redshift Cluster를 생성하면 자동으로 PUBLIC스키마가 생성된다. 기본으로 모든 사용자가 이 스키마에 대한 사용권한을 가지고 있으므로 사용을 피하고, 각 user group 및 user별로 스키마를 구성하여야 한다. 3. 기본 WLM Queue사용 Redsh..
이번에 소개할 내용은 개념 데이터 모델(CDM, Conceptual Data Model)에 속성(Attribute) 도출을 해야하는가? 이다. 사실 필자는 개념 데이터 모델에 속성을 도출하는것을 지양하는 편이다. 이유는 개념 데이터 모델(이하 CDM)의 정의에서 찾을 수 있는데, 개념 데이터 모델의 정의를 먼저 살펴보도록 하자. 개념 데이터 모델(CDM, Conceptual Data Model) : 기호나 텍스트1)로 비즈니스의 개념을 잘 표현한 데이터 모델 즉, CDM으로 비즈니스의 개념을 잘 파악할 수 있어야 하는데, 속성이 도출되어 있을 경우 핵심인 '비즈니스의 개념'보다 해당 속성에 포커싱이 맞추어지는(또는 이슈가 되는) 경우가 생각보다 많이 발생한다는 것이다. 이와 같은 이유로 필자는 가급적 불..