Redukce duplicit

V databázi často není zbytí než povolit duplicity záznamů nenastavením vlastnosti unique u identifikačních prvků v definici dokumentu. Např. tak povolíte neunikátnost IČ v seznamu firem. Pak vám mohou vzniknout dva či více záznamů reprezentující stejný subjekt. Nástroj pro redukci duplicit vám nabízí způsob, jak např. v pravidelných intervalech, či před zavedením jedinečnosti duplicity odstranit.

Princip redukce duplicit pomocí nástroje spočívá v tom, že jsou v databázi dle struktury definované pomocí XDS vyhledány všechny návazné typy a vybrány jejich instance. Jejich výběrové uzly jsou pak přesměrovány na jedinou ponechanou instanci (první nebo poslední dle nastavení úlohy) a ostatní, duplicitní, dokumenty jsou vloženy do koše. Pro identifikaci duplicit slouží nastavení úlohy, jež mají následující formulář:

nahled na formulář duplicity

Výchozím nastavením je zápis typu dokumentu, který musí být proveden plným QName typu dle definice a nesmí se jednat o pohledový dokument. Duplicity v pohledech je třeba řešit v celém balíku jejich běžných typů, ze kterých vycházejí.

Dalším klíčovým nastavením jsou indikátory duplicit - jsou to kolonky označené názvy "Indikátor"... "A" až "C" a indikátory "R-A" až "R-E". Jediný povinný údaj je indikátor "A", ostatní jsou nepovinné. Indikátory "A" až "C" musejí být prvky ukládané v hlavní tabulce dokumentu (hlavní DAD). Zápis hodnoty můžete provést buď formou názvu sloupce tabulky, které je ve vlastnosti name prvku DAD pole nebo jej můžete zadat pomocí jedinečného čísla prvku ve struktuře aplikace - vlastnost idgenerovaná replikátorem (id zjistíte např. pomocí nalistování prvku v prohlížeči kompletního XDS verze). Indikátory mající v názvu "R-.." jsou využity pouze v případě, kdy je třeba duplicitu identifikovat pomocí prvku v opakovatelné části dokumentu. Zde je možné zapisovat identifickaci pouze pomocí již zmíněného id prvku.

Je-li zatržena volba "zachovat poslední", bude z duplicit zachována ta naposledy zadaná a předchozí budou vyhozeny do koše. Jinak bude zachována první zadaná položka a vyhozeny budou naopak ty pozdější. Zatržením volby "přidávat opakování" zajistíte, že opakování, která nebudou shledána jako duplicitní budou z odebíraných dokumentů do ponechaného přidávána jako nová vč. zajištění návaznosti specifikačních uzlů v propojených dokumentech. Poslední zatrhávací volbou je "vložit odkazy na zrušené". Tato zajistí, že všechny duplicitní položky vložené do koše budou dány jako přilohy (do oblasti příloh mezi soubory) k jedné položce, jež byla zachována pro jejich budoucí dohledatelnost a možnost srovnání a případné doplnění údajů do zachované položky.

Jako poslední parametr je tu textová oblast s názvem "Obecná podmínka výběru". Pokud ze slučování duplicit mají být vyloučeny některé položky, zadejte obecnou podmínku v SQL syntaxi kl. WHERE, kterou musí dokumenty zahrnuté do slučování splňovat. Jsou povoleny pouze odkazy na hlavní tabulku, jež má alias 'main'. Tento alias je třeba v odkazech na hodnoty používat.

V souhrnu tento nástroj obsahuje:

Typ dokumentu - zde zadáte systémové jméno dokumentu s duplicitou. (ne zkratku)!!!

Přidávat opakování - zatržením této volby zajístíte, že opakování, která nebudou shledána jako duplicitní budou z odebíraných dokumentů do ponechaného přidávána jako nová včetně zajištění návaznosti specifikačních uzlů v propojených dokumentech.

Vložit odkazy na zrušené - tato volba zajistí, že všechny duplicitní položky vložené do koše budou dány jako přílohy k jedné položce, která byla zachována.

Indikátor A - povinně je třeba zadat jméno alespoň jednoho neopakovatelného prvku formou názvu sloupce hlavní tabulky nebo formou id prvku jehož shoda indikuje duplicitu instancí dokumentu.

Indikátor RA - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Indikátor B - nepovinný druhotný (none-repeatable) indikátor duplicity ve vztahu AND k předchozím (musí být také shodný). Zadejte název slopce hlavní tabulky nebo id prvku.

Indikátor RB - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Indikátor C - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Indikátor RC - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Indikátro RD - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Indikátor RE - v případě možnosti shody v opakovatelných částech je možné tyto identifikovat hodnotou z této části. Zadejte formou id prvku.

Zachovat poslední - je-li volba zatržena bude z duplicit zachována ta naposledy zadaná a předchozí budou vyhozeny do koše. Jinak bude zachována první zadaná položka.

Obecná podmínka výběru. - pokud ze slučování duplicit mají být vyloučeny některé položky, zadejte obecnou podmínku v syntaxi klauzule WHERE, kterou musí dokumenty zahrnuté do slučování splňovat. Jsou povoleny pouze odkazy na hlavní tabulku, jež má alias 'main'.

Pokud je vše potřebné správně nastaveno tak stiskem tlačítko spustit přepočet se spustí přepočet dle nastavené úlohy.


Pracovní složky a nastavení programuOdesílání požadavkůPřevzetí nastaveníTvorba COMEXuImport csv datExport csv datVložení přílohExport příloh z filesDoplňování csv datPřepočet dokumentůRedukce duplicitHledání id v nastaveníchÚprava table settingsTvorba vlastních nástrojů