Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Forumowy magiel: pogaduchy o wszystkim i o niczym.
telesfor
Piegowaty Guziec
Piegowaty Guziec
Posty: 0
Rejestracja: 23 gru 2017, 17:06

Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: telesfor » 23 gru 2017, 17:38

Szanowni użytkownicy i zarządzający.
Wprawdzie używam systemu Windows, ale skoro słyszałem że filozofia Ubuntu opiera się na pojęciu etycznego użytku internetu więc postanowiłem zwrócić się do was. Do pojęcia etykcznego użytku zaliczam osobiście to aby dostawcy usług internetowych umożliwiali użytkownikom możliwość publikacji treści na poniżej okreslonych zasadach.
Szukam odpowiedniego programu do czytania i obróbki tekstu. Chodzi o możliwość przygotowania pliku tekstowego do publikacji w internecie. Chcę, aby tekst tego pliku był ogólnodostępny dla użytkowników, ale niedostępny do sczytywania, indeksowania przez tzw. roboty (boty) Google'a, Facebook'a i innych dostawców usług internetowych.
Poszukiwany program winien posiadać którąś z licencji open source, lub licencję freeware dopuszczającą użytek komercyjny. Winien tworzyć pdf, względnie być jego czytnikiem. A może są też odp. edytory tekstu, in. typy programów z funkcją ukrywania treści przed sczytywaniem? Nie znalazłem jej w programie Adobe reader.
Inne, poszukiwane zalety i funkcje tego programu:
- zabezpieczanie tekstu przed działaniem programów typu OCR i zrzutami ekranu
- zabezpieczanie przed kopiowaniem i wprowadzaniem zmian tekstu, jako zawartości pliku - im silniejszy szyfr tym lepiej. AES jest chyba za słaby?
- możliwość otwierania pliku stworzonego w takim programie w innych, np. w programie A.reader
Program nie powinien też wprowadzać jakichkolwiek podejrzanych zmian. Na przykład niektóre programy podmieniają ikony (w plikach stworzonych przez podobne im programy) na własne. Nawet gdy nie są one ustawione jako programy domyślne. Dlaczego tak bywa?
Z góry dziękuję za życzliwość.
Awatar użytkownika
mario_7
Administrator
Administrator
Posty: 6951
Rejestracja: 30 sie 2006, 13:11
Płeć: Mężczyzna
Wersja Ubuntu: 16.04
Środowisko graficzne: Unity
Architektura: x86_64

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: mario_7 » 23 gru 2017, 18:43

Jeśli o blokowanie robotów chodzi - poczytaj o robots.txt, ale to i tak nic nie blokuje a jedynie prosi o nie czytanie plikow. Jeśli coś jest ogólnodostępne to robot też może czytać.
Ustaw na stronie hasło i robot się nie dostanie.

Co do reszty - szukasz programu który ma robić dziwne rzeczy, a przy tym być kompatybilny z normalnym oprogramowaniem... Sam sie zastanów czy tak sie da... Już pomijam, że niektóre twoje wymagania są bez sensu.

W dodatku to co chciałbyś uzyskać jest w sprzeczności z jakąkolwiek etyką. Jeśli masz zamiar zabraniać OCR, to od razu skreślasz z listy odbiorców osoby niewidzące lub z dużą wadą wzroku - bardzo etyczne...
W dodatku jakieś DRM-y... zastanów się czy w ogóle chcesz coś komuś zrobić i pokazać, bo może powinieneś zabezpieczenie przed patrzeniem wprowadzić...
Czytelnia - poczytaj, Google - poszukaj
telesfor
Piegowaty Guziec
Piegowaty Guziec
Posty: 0
Rejestracja: 23 gru 2017, 17:06

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: telesfor » 30 gru 2017, 11:54

Drogi Mario. Serdecznie dziękuję za odpowiedź i garść złotych myśli. Wezmę je sobie do serca. Co do ustawiania haseł miałem na myśli ustawianie ich w pliku a nie na jakiejkolwiek stronie. Ale z tego, co słyszałem akurat tego typu hasła robotom wstępu nie zabroniłyby?
Niestety co do kwestii etyki jakoś nie możemy się z sobą zgodzić. Otóż, szczerze, bardzo piękną jest idea dotycząca ogólnego dzielenia się wszelkiego rodzaju dobrami, chyba nie tylko wynalazkami z dziedziny programowania. Zważ jednak że owa "wolność dzielenia się" nie sugeruje chyba "dziel się, bo musisz", ale "dziel się, jeśli uznasz to za stosowne"?
Poza tym, czy dzieliłbyś się owocami swojej pracy, na którą musiałeś poświęcić wiele czasu z tymi, którzy chcieliby przywłaszczyć sobie do niej wszelkie prawa a ciebie wyrolować? Niezależnie, czy byłoby to oprogramowanie twojego autorstwa, czy też po prostu słowo pisane - praca naukowa, lub powieść?
Nikomu nie zamierzam "nic robić" jeśli chcesz wiedzieć, ani nikogo "dyskryminować". Ale jeśli uważasz że komuś czynię krzywdę winieneś chyba do grupy niedowidzących dodać wszelkiej maści osoby nadużywające wolności w internecie? I ba, może nawet same roboty? No, bo w końcu czy nawet one nie czułyby się pokrzywdzone?
Szanuję twój pogląd i myślę że ty również uszanujesz mój. Pozdrawiam ciebie.
Awatar użytkownika
mario_7
Administrator
Administrator
Posty: 6951
Rejestracja: 30 sie 2006, 13:11
Płeć: Mężczyzna
Wersja Ubuntu: 16.04
Środowisko graficzne: Unity
Architektura: x86_64

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: mario_7 » 30 gru 2017, 20:11

telesfor pisze:
30 gru 2017, 11:54
Drogi Mario. Serdecznie dziękuję za odpowiedź i garść złotych myśli. Wezmę je sobie do serca. Co do ustawiania haseł miałem na myśli ustawianie ich w pliku a nie na jakiejkolwiek stronie. Ale z tego, co słyszałem akurat tego typu hasła robotom wstępu nie zabroniłyby?
Hasło w pliku? Jeśli robot nie będzie go znał, to nic nie przeczyta.
telesfor pisze:
30 gru 2017, 11:54
Niestety co do kwestii etyki jakoś nie możemy się z sobą zgodzić. Otóż, szczerze, bardzo piękną jest idea dotycząca ogólnego dzielenia się wszelkiego rodzaju dobrami, chyba nie tylko wynalazkami z dziedziny programowania. Zważ jednak że owa "wolność dzielenia się" nie sugeruje chyba "dziel się, bo musisz", ale "dziel się, jeśli uznasz to za stosowne"?
Wiesz jak działa open source? Co to są licencje wirusowe (np. GPL)? Czytałeś o Creative Commons?
Wariantów "wolności" jest wiele. Dzieła można udostępnić w domenie publicznej - każdy może to wziąć i robić z tym co chce. Można zastosować jakąś licencję, która będzie wymagała zachowania informacji o autorze, albo taką, która wymusi zastosowanie tej samej licencji do dzieła pochodnego. Licencji jest wiele i wymuszają różne zachowania...
telesfor pisze:
30 gru 2017, 11:54
Poza tym, czy dzieliłbyś się owocami swojej pracy, na którą musiałeś poświęcić wiele czasu z tymi, którzy chcieliby przywłaszczyć sobie do niej wszelkie prawa a ciebie wyrolować? Niezależnie, czy byłoby to oprogramowanie twojego autorstwa, czy też po prostu słowo pisane - praca naukowa, lub powieść?
Czy zdajesz sobie sprawę na jakim forum zadajesz takie pytanie? To jest forum Ubuntu - jednego z systemów operacyjnych, który jest dostępny za darmo, łącznie z kodem źródłowym na wolnej licencji.
Ten system istnieje, bo ludzie chcą się dzielić owocami swojej pracy. Na tym polega open source - ja zrobiłem coś, a jeśli ty to poprawisz, to podziel się ze światem, aby ktoś mógł ulepszyć to jeszcze bardziej.
Jakiś czas temu Linux Foundation (fundacja opiekująca się jądrem Linux oraz różnymi projektami open source) oszacowała, że kod, którym się opiekuje jest wart ok. 5 miliardów dolarów. A wszystko to dostępne dla każdego kto chce, na wolnej licencji. A kodu na wolnych licencjach pod opieka innych fundacji i innych ludzi jest wielokrotnie więcej...

I o ile zgodzę się, że przywłaszczanie sobie czyjegoś kodu, czy też czegokolwiek innego czyjegoś autorstwa jest nadużyciem (a nawet przestępstwem), to udostępnianie rzeczy na wolnych licencjach jest czymś wręcz pożądanym.

Założenie, że wszyscy dookoła są złodziejami czekającymi aby cię okraść jest chyba trochę przesadzone... Z resztą - jakich byś zabezpieczeń nie użył, to dla naprawdę zainteresowanych ich złamaniem nie będą one przeszkodą.

Gdyby ktoś faktycznie ukradł coś twojego autorstwa (przypisywał autorstwo sobie), albo rozpowszechniał twoje dzieła wbrew twojej woli, to należy takie przypadki zgłaszać do odpowiednich służb i jest to karalne bez względu na zabezpieczenia...
telesfor pisze:
30 gru 2017, 11:54
Nikomu nie zamierzam "nic robić" jeśli chcesz wiedzieć, ani nikogo "dyskryminować". Ale jeśli uważasz że komuś czynię krzywdę winieneś chyba do grupy niedowidzących dodać wszelkiej maści osoby nadużywające wolności w internecie? I ba, może nawet same roboty? No, bo w końcu czy nawet one nie czułyby się pokrzywdzone?
Należy rozróżnić wolność od łamania prawa. Jeśli coś wolno robić, to moim zdaniem szkoda marnować czas aby to komuś utrudniać.
Doświadczenie mówi, że wszelkiej maści zabezpieczenia dostępu do danych są największym problemem dla tych, który chcą z nich korzystać legalnie - spójrz np. na gry komputerowe albo oprogramowanie komputerowe. Uczciwi użytkownicy mają "pod górkę", bo muszą aktywować swoje produkty na jakichś serwerach, albo przez telefon, a tzw. piraci po prostu używają tego co chcą, bez zbędnych aktywacji, bez konieczności bycia podłączonym do internetu i niczym się nie przejmują. Oczywiście, nie oznacza, to że ci drudzy mają rację i tak należy robić - ale zauważ że tak się właśnie dzieje z rzeczami do których ogranicza się normalny dostęp.
telesfor pisze:
30 gru 2017, 11:54
Szanuję twój pogląd i myślę że ty również uszanujesz mój. Pozdrawiam ciebie.
Moje podejście jest takie, że jeśli chcę coś udostępnić, to chcę aby jak najwięcej osób mogło z tego skorzystać, a nie żeby jak najmniej osób mogło to zobaczyć...
A co do pieniędzy (bo pewnie do tego się ta dyskusja sprowadza), to mądre wykorzystanie zasad open source generuje fortuny. W drugą stronę też to działa - nawet najbogatsi na tym świecie korzystają z open source.

Może jeszcze pokażę ci bezcelowość twoich poszukiwań:

A co gdybym na sowim komputerze, po zdobyciu hasła, pokazał znajomemu plik, który tak pieczołowicie zabezpieczyłeś...?
A co jeśli zrobię zdjęcia ekranu z twoim plikiem?
A co jeśli te zdjęcia wrzucę na OCR i potem sam tekst udostępnię w internecie?
A co jeśli szybko piszę i czytając będę przepisywał tekst na nowo w innym dokumencie?
A co jeśli udostępnię pulpit przez internet komuś innemu?

Nie zabezpieczysz się przed wszystkim... Jeszcze nikomu się nie udało, a wielu próbowało. Życie utrudnisz tylko tym, co będą chcieli po prostu zobaczyć to co masz im do pokazania...
Czytelnia - poczytaj, Google - poszukaj
rrico
Sędziwy Jeż
Sędziwy Jeż
Posty: 77
Rejestracja: 22 kwie 2017, 11:32
Płeć: Mężczyzna
Wersja Ubuntu: 16.04
Środowisko graficzne: Inne
Architektura: x86_64
Lokalizacja: óć-pl

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: rrico » 03 sty 2018, 12:52

Taki dostyć drastyczny przykład sprzed kilku lat na innym forum: kumpel (amator) umieścił na swojej stronie i zabezpieczył utwór muzyczny. A na forum podał nam linka do jakiejś brazylijskiej kapeli, która to nagrała i wydała na swojej oficjalnej płycie. Stronkę miał jakoś tam zabezpieczoną, ale nie wnikałem w jaki sposób. Fakt faktem, że naruszenie praw autorskich miało miejsce. I nic z tym nie można IMO zrobić, bo to międzynarodowe, skąd można wiedzieć jakie prawo mają w kraju na końcu świata i jak go dochodzić.
Kolega też bardzo się obruszył, ale ponieważ robił to amatorsko to w końcu odpuścił. I tak samo, chciał po prostu pokazać ludziom co tam sobie ciekawego nagrał w domu.
----------------------------------------------------
Ubuntu MATE 16.04.2 LTS x64 (tymczasowo offline) | Składak
Limux Mint 18.2 Mate/Cinnamon x64 (bieżący) | Toshiba Satellite A350
telesfor
Piegowaty Guziec
Piegowaty Guziec
Posty: 0
Rejestracja: 23 gru 2017, 17:06

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: telesfor » 06 sty 2018, 16:13

Hasło w pliku? Jeśli robot nie będzie go znał, to nic nie przeczyta.
Słyszałem gdzieś przeciwną opinię.
Nadto zapomniałem uściślić że chodziło o hasło wzbraniające wprowadzania zmian w pliku. A nie o hasło wzbraniające dostępu do niego.

Mario: mam ogólne pojęcie o open source. O wytycznych, jakie musi spełniać program by być uznanym za tego typu dzieło. I o różnorodności licencji. Rozumiem że ten, kto chce zmieniać program winien zastosować tę samą licencję w swoim dziele jak ta, na której opierał się program wyjściowy. Sam czułbym się "wewnętrznie" i prawnie zobowiązany do tego, gdybym programował. Co nie znaczy że tak samo winienem czuć się zobowiązany dzielić się własną przeróbką. Prawo chyba też nie zobowiązuje do tego? Co innego, gdybym chciał. Ale nie mówiłbym że kod jest moją własnością, skoro nie nabyłem do niego praw własności ani nie był mojego autorstwa.
Nie jestem programistą, ale interesuje mnie literatura piękna, jeśli chcesz wiedzieć. I stąd mowa o publikacji. Zarobek wchodzi w grę, ale w dalszym planie.
Zresztą co do programowania to można wprowadzać nawet niewielkie zmiany. Gdy chodzi o literaturę to tego typu wydawanie pod własnym nazwiskiem uznawane jest za plagiat. Co innego inspiracja.

Nie zakładam też że wszyscy są złodziejami. Ani że każdy skorzystałby z okazji, która "czyni złodzieja". Przypuszczam jedynie że ludzie są bardzo różni. Na tej podstawie chcę jedynie zabezpieczyć się na tyle, na ile się da.
Domyślam się że nie ma doskonałych zabezpieczeń. Ale jak ktoś kiedyś słusznie zauważył: czy z tego powodu zostawiłbyś mieszkanie otwarte, bo zawsze może znaleźć sie ktoś, kto sforsuje najlepszy zamek? Złodziej złodziejowi nierówny.
Rzecz w tym, aby uczciwym maksymalnie ułatwić korzystanie z pliku, a nieuczciwym maksymalnie utrudnić możliwość kradzieży.
telesfor
Piegowaty Guziec
Piegowaty Guziec
Posty: 0
Rejestracja: 23 gru 2017, 17:06

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: telesfor » 06 sty 2018, 16:26

Mario: pisałeś też o pliku robots.txt. Czytałem. Zatem może robot przeczyta i tak, ale przynajmniej nie zindeksuje i nie będzie śledził. O ile zorientowałem się nawet ja mógłbym stworzyć taki plik w Notatniku. Tylko co dalej?
Można przekopiować treść takiego pliku do jednego z pól do wypełnienia danych w pliku pdf? Myślę o polu do umieszczania słów kluczowych, obok pola na informację o imieniu i nazwisku autora, o prawach autorskich itp.Tyle że tu chyba zawsze może znaleźć się ktoś, kto usunie te informacje.
Może więc jest prosty sposób by dołączyć taki plik do pobranego uprzednio kodu źródłowego? I co zrobić by dany program do plików pdf zadziałał w oparciu o tak zmieniony kod?
A może wystarczy tylko dodać taki nowoutworzony plik do reszty plików składającyh się na taki program?
Awatar użytkownika
mario_7
Administrator
Administrator
Posty: 6951
Rejestracja: 30 sie 2006, 13:11
Płeć: Mężczyzna
Wersja Ubuntu: 16.04
Środowisko graficzne: Unity
Architektura: x86_64

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: mario_7 » 07 sty 2018, 23:40

Mieszasz kilka rzeczy...

Open source można stosować do wielu rzeczy, nie tylko oprogramowania. I generalnie wszystko zależy od licencji. Zazwyczaj jeśli chcesz sobie coś przerobić na własny użytek, to proszę bardzo i nie musisz nic nikomu udostępniać.

A przywłaszczanie sobie czyjegoś dzieła jest nielegalne i nie ma związku z przerabianiem...

W świecie sztuki też są różne sposoby na zmodyfikowanie czyjegoś dzieła...

Co do zostawiania otwartego mieszkania - nie piszemy tutaj o absurdach. Idąc tym tokiem myślenia - drzwi do twojego domu to pewnie wrota jak w jakimś skarbcu z rezerwami złota dla banku?
Należy stosować zabezpieczenia adekwatne do sytuacji - tylko tyle i aż tyle.

robots.txt to plik związany z serwerami www i tam się go umieszcza. Ale nie ma przymusu stosowania się do niego - zawiera tylko sugestie, do których większość się stosuje, ale nie każdy to robi.

Może wróćmy do tematu... Jeśli chodzi o PDF i jego zabezpieczenia: https://www.adobe.com/content/dam/acom/ ... ial-ue.pdf
Ale to nie uchroni przed OCR i robieniem zdjęć tekstu - przed tym nie da się ochronić.

Jeśli chodzi o inne sposoby ochrony, albo chociaż dociekania skąd pojawił się przeciek - różne metody są stosowane - niektórzy np. generują książki troszkę inaczej dla każdego klienta (inaczej ponumerowane strony, w innym miejscu łamią się słowa, inne odstępy między znakami, jakieś metadane, białe znaki, szare, prawie niewidoczne wzorki w tle itp itd.) - aby później zidentyfikować do kogo należała książka, gdyby okazało się, że została gdzieś udostępniona nielegalnie.
Czytelnia - poczytaj, Google - poszukaj
rrico
Sędziwy Jeż
Sędziwy Jeż
Posty: 77
Rejestracja: 22 kwie 2017, 11:32
Płeć: Mężczyzna
Wersja Ubuntu: 16.04
Środowisko graficzne: Inne
Architektura: x86_64
Lokalizacja: óć-pl

Re: Program do pubikacji tekstu w necie z możliwością blokowania indeksowania przez roboty

Post autor: rrico » 08 sty 2018, 09:19

A przede wszystkim powinieneś jasno, w wyraźnym miejscu informować klienta (z reguły człowiek, nie wszystkie to boty) o prawach autorskich. Większość ludzi (albo tak mi się wydaje) ma wbudowany taki mechanizm zwany moralnością, dlatego nie konieczmie ma ochotę naruszać prawo autorskie jeżeli już ma jego świadomość. Logiczna sprawa: wiem, że ten utwór jest czyjąś własnością, koleś się napocił żeby to napisać, to po co mam kopiować/sprzedawać, skoro i tak mam do tego dostęp w każdym momencie albo mój potencjalny klient też ma. Zwyczajnie nie ma sensu. Także większe zabezpieczenia moim zdaniem nie są potrzebne. Kto ma spiracić to i tak spiraci, ale to marginalna sprawa jak wszystko zrobisz w świetle dnia.
----------------------------------------------------
Ubuntu MATE 16.04.2 LTS x64 (tymczasowo offline) | Składak
Limux Mint 18.2 Mate/Cinnamon x64 (bieżący) | Toshiba Satellite A350
ODPOWIEDZ

Wróć do „Pogaduchy”