Skip to content

Latest commit

 

History

History
193 lines (121 loc) · 30.4 KB

File metadata and controls

193 lines (121 loc) · 30.4 KB

ಅನುವಾದ ಮತ್ತು ಭಾವನಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ ML ನೊಂದಿಗೆ

ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ ನೀವು TextBlob ಬಳಸಿ ಮೂಲ ಬಾಟ್ ಅನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುವುದು ಎಂದು ಕಲಿತಿರಿ, ಇದು ಮೂಲಭೂತ NLP ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಲು ML ಅನ್ನು ಹಿಂಬದಿಯಲ್ಲಿ ಒಳಗೊಂಡಿರುವ ಗ್ರಂಥಾಲಯವಾಗಿದೆ, ಉದಾಹರಣೆಗೆ ನಾಮಪದ ವಾಕ್ಯাংশ ಹೊರತೆಗೆಯುವುದು. ಗಣಕ ಭಾಷಾಶಾಸ್ತ್ರದಲ್ಲಿ ಮತ್ತೊಂದು ಪ್ರಮುಖ ಸವಾಲು ಎಂದರೆ ಒಂದು ಮಾತಾಡುವ ಅಥವಾ ಬರೆಯುವ ಭಾಷೆಯಿಂದ ಮತ್ತೊಂದು ಭಾಷೆಗೆ ವಾಕ್ಯವನ್ನು ನಿಖರವಾಗಿ ಅನುವಾದ ಮಾಡುವುದು.

ಅನುವಾದವು ಬಹಳ ಕಠಿಣ ಸಮಸ್ಯೆಯಾಗಿದ್ದು, ಸಾವಿರಾರು ಭಾಷೆಗಳಿದ್ದು ಪ್ರತಿಯೊಂದು ಭಾಷೆಯು ವಿಭಿನ್ನ ವ್ಯಾಕರಣ ನಿಯಮಗಳನ್ನು ಹೊಂದಿರುವುದರಿಂದ ಅದು ಇನ್ನಷ್ಟು ಸಂಕೀರ್ಣವಾಗುತ್ತದೆ. ಒಂದು ವಿಧಾನವೆಂದರೆ ಒಂದು ಭಾಷೆಯ, ಉದಾಹರಣೆಗೆ ಇಂಗ್ಲಿಷ್‌ನ, ಅಧಿಕೃತ ವ್ಯಾಕರಣ ನಿಯಮಗಳನ್ನು ಭಾಷಾ-ಆಧಾರಿತವಲ್ಲದ ರಚನೆಗೆ ಪರಿವರ್ತಿಸಿ, ನಂತರ ಅದನ್ನು ಮತ್ತೊಂದು ಭಾಷೆಗೆ ಮರಳಿಸಿ ಅನುವಾದಿಸುವುದು. ಈ ವಿಧಾನದಲ್ಲಿ ನೀವು ಕೆಳಗಿನ ಹಂತಗಳನ್ನು ಅನುಸರಿಸುತ್ತೀರಿ:

  1. ಗುರುತಿಸುವಿಕೆ. ಇನ್ಪುಟ್ ಭಾಷೆಯ ಪದಗಳನ್ನು ನಾಮಪದ, ಕ್ರಿಯಾಪದ ಇತ್ಯಾದಿಯಾಗಿ ಗುರುತಿಸುವುದು ಅಥವಾ ಟ್ಯಾಗ್ ಮಾಡುವುದು.
  2. ಅನುವಾದ ಸೃಷ್ಟಿ. ಗುರಿ ಭಾಷೆಯ ಸ್ವರೂಪದಲ್ಲಿ ಪ್ರತಿ ಪದದ ನೇರ ಅನುವಾದವನ್ನು ಉತ್ಪಾದಿಸುವುದು.

ಉದಾಹರಣೆಯ ವಾಕ್ಯ, ಇಂಗ್ಲಿಷ್ ನಿಂದ ಐರಿಷ್

'ಇಂಗ್ಲಿಷ್' ನಲ್ಲಿ, ವಾಕ್ಯ I feel happy ಮೂರು ಪದಗಳಿದ್ದು ಕ್ರಮದಲ್ಲಿ:

  • ವಿಷಯ (I)
  • ಕ್ರಿಯಾಪದ (feel)
  • ವಿಶೇಷಣ (happy)

ಆದರೆ, 'ಐರಿಷ್' ಭಾಷೆಯಲ್ಲಿ, ಅದೇ ವಾಕ್ಯವು ಬಹಳ ವಿಭಿನ್ನ ವ್ಯಾಕರಣ ರಚನೆ ಹೊಂದಿದೆ - "happy" ಅಥವಾ "sad" ಎಂಬ ಭಾವನೆಗಳನ್ನು ನಿಮ್ಮ ಮೇಲೆ ಇರುವಂತೆ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ.

ಇಂಗ್ಲಿಷ್ ವಾಕ್ಯ I feel happy ಐರಿಷ್‌ನಲ್ಲಿ Tá athas orm ಆಗಿರುತ್ತದೆ. ಶಬ್ದಾರ್ಥ ಅನುವಾದವು Happy is upon me ಆಗಿರುತ್ತದೆ.

ಐರಿಷ್ ಮಾತನಾಡುವವರು ಇಂಗ್ಲಿಷ್‌ಗೆ ಅನುವಾದಿಸುವಾಗ I feel happy ಎಂದು ಹೇಳುತ್ತಾರೆ, Happy is upon me ಎಂದು ಅಲ್ಲ, ಏಕೆಂದರೆ ಅವರು ವಾಕ್ಯದ ಅರ್ಥವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತಾರೆ, ಪದಗಳು ಮತ್ತು ವಾಕ್ಯ ರಚನೆ ವಿಭಿನ್ನವಾಗಿದ್ದರೂ.

ಐರಿಷ್ ವಾಕ್ಯದ ಅಧಿಕೃತ ಕ್ರಮಗಳು:

  • ಕ್ರಿಯಾಪದ (Tá ಅಥವಾ is)
  • ವಿಶೇಷಣ (athas, ಅಥವಾ happy)
  • ವಿಷಯ (orm, ಅಥವಾ upon me)

ಅನುವಾದ

ಸರಳ ಅನುವಾದ ಕಾರ್ಯಕ್ರಮವು ಪದಗಳನ್ನು ಮಾತ್ರ ಅನುವಾದಿಸಬಹುದು, ವಾಕ್ಯ ರಚನೆಯನ್ನು ಗಮನಿಸದೆ.

✅ ನೀವು ವಯಸ್ಕನಾಗಿ ಎರಡನೇ (ಅಥವಾ ಮೂರನೇ ಅಥವಾ ಹೆಚ್ಚು) ಭಾಷೆಯನ್ನು ಕಲಿತಿದ್ದರೆ, ನೀವು ನಿಮ್ಮ ಮೂಲ ಭಾಷೆಯಲ್ಲಿ ಯೋಚಿಸಿ, ತಲೆಯೊಳಗೆ ಪದದಿಂದ ಪದಕ್ಕೆ ಎರಡನೇ ಭಾಷೆಗೆ ಅನುವಾದಿಸಿ, ನಂತರ ನಿಮ್ಮ ಅನುವಾದವನ್ನು ಮಾತನಾಡಲು ಪ್ರಾರಂಭಿಸಿದ್ದೀರಿ. ಇದು ಸರಳ ಅನುವಾದ ಕಂಪ್ಯೂಟರ್ ಕಾರ್ಯಕ್ರಮಗಳು ಮಾಡುವುದಕ್ಕೆ ಸಮಾನವಾಗಿದೆ. ಈ ಹಂತವನ್ನು ದಾಟಿ ಪ್ರವಾಹಿತ ಭಾಷಾ ನಿಪುಣತೆಯನ್ನು ಪಡೆಯುವುದು ಮುಖ್ಯ!

ಸರಳ ಅನುವಾದವು ಕೆಟ್ಟ (ಮತ್ತು ಕೆಲವೊಮ್ಮೆ ಹಾಸ್ಯಾಸ್ಪದ) ತಪ್ಪು ಅನುವಾದಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ: I feel happy ಅನ್ನು ಐರಿಷ್‌ನಲ್ಲಿ ಶಬ್ದಾರ್ಥವಾಗಿ Mise bhraitheann athas ಎಂದು ಅನುವಾದಿಸಲಾಗುತ್ತದೆ. ಇದರ ಅರ್ಥ (ಶಬ್ದಾರ್ಥವಾಗಿ) me feel happy ಆಗಿದ್ದು, ಇದು ಮಾನ್ಯ ಐರಿಷ್ ವಾಕ್ಯವಲ್ಲ. ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಐರಿಷ್ ಎರಡು ಸಮೀಪದ ದ್ವೀಪಗಳಲ್ಲಿ ಮಾತನಾಡುವ ಭಾಷೆಗಳಾಗಿದ್ದರೂ, ಅವು ವಿಭಿನ್ನ ವ್ಯಾಕರಣ ರಚನೆಗಳನ್ನು ಹೊಂದಿವೆ.

ನೀವು ಐರಿಷ್ ಭಾಷಾ ಪರಂಪರೆಗಳ ಬಗ್ಗೆ ಕೆಲವು ವೀಡಿಯೊಗಳನ್ನು ನೋಡಬಹುದು, ಉದಾಹರಣೆಗೆ ಇದು

ಯಂತ್ರ ಅಧ್ಯಯನ ವಿಧಾನಗಳು

ಈವರೆಗೆ, ನೀವು ನೈಸರ್ಗಿಕ ಭಾಷಾ ಪ್ರಕ್ರಿಯೆಗೆ ಅಧಿಕೃತ ನಿಯಮಗಳ ವಿಧಾನವನ್ನು ಕಲಿತಿದ್ದೀರಿ. ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಪದಗಳ ಅರ್ಥವನ್ನು ನಿರ್ಲಕ್ಷಿಸಿ, ಬದಲಾಗಿ ಯಂತ್ರ ಅಧ್ಯಯನವನ್ನು ಬಳಸಿ ಮಾದರಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚುವುದು. ಮೂಲ ಮತ್ತು ಗುರಿ ಭಾಷೆಗಳಲ್ಲಿ ಸಾಕಷ್ಟು ಪಠ್ಯ (ಒಂದು ಕೋರ್ಪಸ್ ಅಥವಾ ಕೋರ್ಪೋರಾ) ಇದ್ದರೆ ಇದು ಅನುವಾದದಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು.

ಉದಾಹರಣೆಗೆ, 1813 ರಲ್ಲಿ ಜೇನ್ ಆಸ್ಟಿನ್ ಬರೆದ ಪ್ರಸಿದ್ಧ ಇಂಗ್ಲಿಷ್ ناವಲ Pride and Prejudice ಯನ್ನು ಪರಿಗಣಿಸಿ. ನೀವು ಇಂಗ್ಲಿಷ್ ಪುಸ್ತಕ ಮತ್ತು ಅದರ ಮಾನವ ಅನುವಾದವನ್ನು ಫ್ರೆಂಚ್ ನಲ್ಲಿ ಪರಿಶೀಲಿಸಿದರೆ, ಒಂದು ಭಾಷೆಯಲ್ಲಿನ ವಾಕ್ಯಗಳು ಇನ್ನೊಂದು ಭಾಷೆಗೆ ಪ್ರಚಲಿತವಾಗಿ ಅನುವಾದವಾಗಿರುವುದನ್ನು ಪತ್ತೆಹಚ್ಚಬಹುದು. ನೀವು ಅದನ್ನು ಕ್ಷಣದಲ್ಲೇ ಮಾಡುತ್ತೀರಿ.

ಉದಾಹರಣೆಗೆ, ಇಂಗ್ಲಿಷ್ ವಾಕ್ಯ I have no money ಅನ್ನು ಫ್ರೆಂಚ್‌ಗೆ ಶಬ್ದಾರ್ಥವಾಗಿ ಅನುವಾದಿಸಿದಾಗ, ಅದು Je n'ai pas de monnaie ಆಗಬಹುದು. "Monnaie" ಒಂದು ಕಪಟ ಫ್ರೆಂಚ್ 'false cognate', ಏಕೆಂದರೆ 'money' ಮತ್ತು 'monnaie' ಸಮಾನಾರ್ಥಕವಲ್ಲ. ಮಾನವನು ಮಾಡಬಹುದಾದ ಉತ್ತಮ ಅನುವಾದ Je n'ai pas d'argent ಆಗಿರುತ್ತದೆ, ಏಕೆಂದರೆ ಇದು ನೀವು ಹಣವಿಲ್ಲ ಎಂದು ಉತ್ತಮವಾಗಿ ಸೂಚಿಸುತ್ತದೆ (ಮತ್ತೆ 'monnaie' ಅರ್ಥ 'ಲೂಸ್ ಚೇಂಜ್').

monnaie

ಚಿತ್ರ Jen Looper ಅವರಿಂದ

ಯಂತ್ರ ಅಧ್ಯಯನ ಮಾದರಿಯು ಸಾಕಷ್ಟು ಮಾನವ ಅನುವಾದಗಳನ್ನು ಹೊಂದಿದ್ದರೆ, ಅದು ಎರಡೂ ಭಾಷೆಗಳ ಪರಿಣತ ಮಾನವರಿಂದ ಹಿಂದಿನ ಅನುವಾದಗಳಲ್ಲಿ ಕಂಡ ಸಾಮಾನ್ಯ ಮಾದರಿಗಳನ್ನು ಗುರುತಿಸಿ ಅನುವಾದಗಳ ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸಬಹುದು.

ಅಭ್ಯಾಸ - ಅನುವಾದ

ನೀವು ವಾಕ್ಯಗಳನ್ನು ಅನುವಾದಿಸಲು TextBlob ಅನ್ನು ಬಳಸಬಹುದು. ಪ್ರಸಿದ್ಧ Pride and Prejudice ಮೊದಲ ಸಾಲನ್ನು ಪ್ರಯತ್ನಿಸಿ:

from textblob import TextBlob

blob = TextBlob(
    "It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife!"
)
print(blob.translate(to="fr"))

TextBlob ಅನುವಾದದಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ: "C'est une vérité universellement reconnue, qu'un homme célibataire en possession d'une bonne fortune doit avoir besoin d'une femme!".

TextBlob ನ ಅನುವಾದವು 1932 ರಲ್ಲಿ V. Leconte ಮತ್ತು Ch. Pressoir ಅವರಿಂದ ಮಾಡಿದ ಫ್ರೆಂಚ್ ಅನುವಾದಕ್ಕಿಂತ ಬಹಳ ನಿಖರವಾಗಿದೆ ಎಂದು ವಾದಿಸಬಹುದು:

"C'est une vérité universelle qu'un célibataire pourvu d'une belle fortune doit avoir envie de se marier, et, si peu que l'on sache de son sentiment à cet egard, lorsqu'il arrive dans une nouvelle résidence, cette idée est si bien fixée dans l'esprit de ses voisins qu'ils le considèrent sur-le-champ comme la propriété légitime de l'une ou l'autre de leurs filles."

ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಯಂತ್ರ ಅಧ್ಯಯನದಿಂದ ತಿಳಿದಿರುವ ಅನುವಾದವು ಮೂಲ ಲೇಖಕರ ಮಾತುಗಳಿಗೆ ಅನಗತ್ಯವಾಗಿ ಪದಗಳನ್ನು ಸೇರಿಸುವ ಮಾನವ ಅನುವಾದಿಗಿಂತ ಉತ್ತಮ ಕೆಲಸ ಮಾಡುತ್ತದೆ.

ಇಲ್ಲಿ ಏನಾಗುತ್ತಿದೆ? ಮತ್ತು TextBlob ಅನುವಾದದಲ್ಲಿ ಏಕೆ ಇಷ್ಟು ಉತ್ತಮವಾಗಿದೆ? ಹೌದು, ಹಿಂಬದಿಯಲ್ಲಿ, ಇದು Google translate ಅನ್ನು ಬಳಸುತ್ತಿದೆ, ಇದು ಲಕ್ಷಾಂತರ ವಾಕ್ಯಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿ ಕಾರ್ಯಕ್ಕೆ ಅತ್ಯುತ್ತಮ ಸರಣಿಗಳನ್ನು ಊಹಿಸುವ ಸುಧಾರಿತ AI. ಇಲ್ಲಿ ಯಾವುದೇ ಕೈಯಿಂದ ಮಾಡಲಾಗುವುದಿಲ್ಲ ಮತ್ತು blob.translate ಬಳಸಲು ಇಂಟರ್ನೆಟ್ ಸಂಪರ್ಕ ಬೇಕಾಗುತ್ತದೆ.

✅ ಇನ್ನಷ್ಟು ವಾಕ್ಯಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಯಾವುದು ಉತ್ತಮ, ML ಅಥವಾ ಮಾನವ ಅನುವಾದ? ಯಾವ ಸಂದರ್ಭಗಳಲ್ಲಿ?

ಭಾವನಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ

ಮತ್ತೊಂದು ಕ್ಷೇತ್ರದಲ್ಲಿ ಯಂತ್ರ ಅಧ್ಯಯನವು ಚೆನ್ನಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂದರೆ ಭಾವನಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ. ಭಾವನಾತ್ಮಕತೆಯ ಅ-ML ವಿಧಾನವು 'ಧನಾತ್ಮಕ' ಮತ್ತು 'ನಕಾರಾತ್ಮಕ' ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಗುರುತಿಸುವುದು. ನಂತರ, ಹೊಸ ಪಠ್ಯವನ್ನು ನೀಡಿದಾಗ, ಒಟ್ಟು ಧನಾತ್ಮಕ, ನಕಾರಾತ್ಮಕ ಮತ್ತು ತಟಸ್ಥ ಪದಗಳ ಮೌಲ್ಯವನ್ನು ಲೆಕ್ಕಿಸಿ ಒಟ್ಟು ಭಾವನಾತ್ಮಕತೆಯನ್ನು ಗುರುತಿಸುವುದು.

ಈ ವಿಧಾನವು ಸುಲಭವಾಗಿ ಮೋಸಗೊಳ್ಳುತ್ತದೆ, ನೀವು Marvin ಕಾರ್ಯದಲ್ಲಿ ನೋಡಿದಂತೆ - ವಾಕ್ಯ Great, that was a wonderful waste of time, I'm glad we are lost on this dark road ಒಂದು ವ್ಯಂಗ್ಯಾತ್ಮಕ, ನಕಾರಾತ್ಮಕ ಭಾವನಾತ್ಮಕ ವಾಕ್ಯ, ಆದರೆ ಸರಳ ಅಲ್ಗಾರಿದಮ್ 'great', 'wonderful', 'glad' ಅನ್ನು ಧನಾತ್ಮಕವಾಗಿ ಮತ್ತು 'waste', 'lost' ಮತ್ತು 'dark' ಅನ್ನು ನಕಾರಾತ್ಮಕವಾಗಿ ಗುರುತಿಸುತ್ತದೆ. ಒಟ್ಟು ಭಾವನಾತ್ಮಕತೆ ಈ ವಿರುದ್ಧ ಪದಗಳಿಂದ ಪ್ರಭಾವಿತವಾಗುತ್ತದೆ.

✅ ಒಂದು ಕ್ಷಣ ನಿಲ್ಲಿ ಮತ್ತು ನಾವು ಮಾನವ ಮಾತನಾಡುವವರಾಗಿ ವ್ಯಂಗ್ಯವನ್ನು ಹೇಗೆ ವ್ಯಕ್ತಪಡಿಸುತ್ತೇವೆ ಎಂದು ಯೋಚಿಸಿ. ಧ್ವನಿಯ ಉಚ್ಛಾರಣೆಯು ದೊಡ್ಡ ಪಾತ್ರ ವಹಿಸುತ್ತದೆ. "Well, that film was awesome" ಎಂಬ ವಾಕ್ಯವನ್ನು ವಿಭಿನ್ನ ರೀತಿಯಲ್ಲಿ ಹೇಳಿ ನಿಮ್ಮ ಧ್ವನಿ ಅರ್ಥವನ್ನು ಹೇಗೆ ವ್ಯಕ್ತಪಡಿಸುತ್ತದೆ ಎಂದು ಕಂಡುಹಿಡಿಯಿರಿ.

ML ವಿಧಾನಗಳು

ML ವಿಧಾನವು ನಕಾರಾತ್ಮಕ ಮತ್ತು ಧನಾತ್ಮಕ ಪಠ್ಯಗಳನ್ನು - ಟ್ವೀಟ್‌ಗಳು, ಚಲನಚಿತ್ರ ವಿಮರ್ಶೆಗಳು ಅಥವಾ ಮಾನವರು ಅಂಕೆ ಮತ್ತು ಬರಹ ಅಭಿಪ್ರಾಯ ನೀಡಿದ ಯಾವುದೇ ಪಠ್ಯಗಳನ್ನು ಕೈಯಿಂದ ಸಂಗ್ರಹಿಸುವುದು. ನಂತರ NLP ತಂತ್ರಗಳನ್ನು ಅಭಿಪ್ರಾಯಗಳು ಮತ್ತು ಅಂಕೆಗಳಿಗೆ ಅನ್ವಯಿಸಿ, ಮಾದರಿಗಳು ಹೊರಬರುತ್ತವೆ (ಉದಾ: ಧನಾತ್ಮಕ ಚಲನಚಿತ್ರ ವಿಮರ್ಶೆಗಳಲ್ಲಿ 'Oscar worthy' ಪದಗಳು ನಕಾರಾತ್ಮಕ ವಿಮರ್ಶೆಗಿಂತ ಹೆಚ್ಚು ಕಾಣಿಸಬಹುದು, ಅಥವಾ ಧನಾತ್ಮಕ ರೆಸ್ಟೋರೆಂಟ್ ವಿಮರ್ಶೆಗಳಲ್ಲಿ 'gourmet' ಪದವು 'disgusting' ಗಿಂತ ಹೆಚ್ಚು).

⚖️ ಉದಾಹರಣೆ: ನೀವು ರಾಜಕಾರಣಿಯ ಕಚೇರಿಯಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೀರಿ ಮತ್ತು ಹೊಸ ಕಾಯ್ದೆ ಚರ್ಚೆಯಲ್ಲಿದೆ ಎಂದು ಊಹಿಸೋಣ, ನಾಗರಿಕರು ಆ ಕಾಯ್ದೆಗೆ ಬೆಂಬಲಿಸುವ ಅಥವಾ ವಿರೋಧಿಸುವ ಇಮೇಲ್‌ಗಳನ್ನು ಕಚೇರಿಗೆ ಬರೆಯಬಹುದು. ನೀವು ಆ ಇಮೇಲ್‌ಗಳನ್ನು ಓದಿ ಎರಡು ಗುಂಪುಗಳಲ್ಲಿ, ಬೆಂಬಲ ಮತ್ತು ವಿರೋಧ ಎಂದು ವಿಂಗಡಿಸುವ ಕೆಲಸವನ್ನು ಮಾಡಬೇಕಾಗಬಹುದು. ಇಮೇಲ್‌ಗಳು ಬಹಳವಾಗಿದ್ದರೆ, ಅವುಗಳನ್ನು ಓದಲು ನೀವು ಅತಿಯಾದ ಒತ್ತಡಕ್ಕೆ ಒಳಗಾಗಬಹುದು. ಒಂದು ಬಾಟ್ ಅವುಗಳನ್ನು ಓದಿ, ಅರ್ಥಮಾಡಿಕೊಂಡು, ಯಾವ ಗುಂಪಿಗೆ ಸೇರಬೇಕೆಂದು ಹೇಳಿದರೆ ಚೆನ್ನಾಗಿರುತ್ತದೆಯೇ?

ಅದನ್ನು ಸಾಧಿಸುವ ಒಂದು ವಿಧಾನ ಯಂತ್ರ ಅಧ್ಯಯನವನ್ನು ಬಳಸುವುದು. ನೀವು ವಿರೋಧ ಇಮೇಲ್‌ಗಳ ಒಂದು ಭಾಗ ಮತ್ತು ಬೆಂಬಲ ಇಮೇಲ್‌ಗಳ ಒಂದು ಭಾಗವನ್ನು ಮಾದರಿಯನ್ನು ತರಬೇತುಗೊಳಿಸಲು ಬಳಸುತ್ತೀರಿ. ಮಾದರಿ ವಿರೋಧ ಮತ್ತು ಬೆಂಬಲ ಗುಂಪುಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಗುರುತಿಸುವುದು, ಆದರೆ ಯಾವುದೇ ವಿಷಯವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದಿಲ್ಲ, ಕೇವಲ ಕೆಲವು ಪದಗಳು ಮತ್ತು ಮಾದರಿಗಳು ಯಾವ ಗುಂಪಿನಲ್ಲಿ ಹೆಚ್ಚು ಕಾಣಿಸಬಹುದು ಎಂದು ತಿಳಿದುಕೊಳ್ಳುತ್ತದೆ. ನೀವು ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೆ ಬಳಸದ ಇಮೇಲ್‌ಗಳೊಂದಿಗೆ ಪರೀಕ್ಷಿಸಿ, ನೀವು ತಲುಪಿದ ನಿರ್ಣಯಕ್ಕೆ ಅದು ಸಹಮತಿಯಾಗಿದೆಯೇ ಎಂದು ನೋಡಬಹುದು. ನಂತರ, ನೀವು ಮಾದರಿಯ ನಿಖರತೆಯಿಂದ ಸಂತೃಪ್ತರಾದಾಗ, ಭವಿಷ್ಯದ ಇಮೇಲ್‌ಗಳನ್ನು ಓದದೆ ಪ್ರಕ್ರಿಯೆ ಮಾಡಬಹುದು.

✅ ಈ ಪ್ರಕ್ರಿಯೆ ನೀವು ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ ಬಳಸಿದ ಪ್ರಕ್ರಿಯೆಗಳಂತೆ ತೋರುತ್ತದೆಯೇ?

ಅಭ್ಯಾಸ - ಭಾವನಾತ್ಮಕ ವಾಕ್ಯಗಳು

ಭಾವನಾತ್ಮಕತೆ -1 ರಿಂದ 1 ರ ಪೋಲಾರಿಟಿ ಮೂಲಕ ಅಳೆಯಲಾಗುತ್ತದೆ, ಅಂದರೆ -1 ಅತ್ಯಂತ ನಕಾರಾತ್ಮಕ ಭಾವನಾತ್ಮಕತೆ ಮತ್ತು 1 ಅತ್ಯಂತ ಧನಾತ್ಮಕ. ಭಾವನಾತ್ಮಕತೆ 0 - 1 ಅಂಕೆಯೊಂದಿಗೆ ವಸ್ತುನಿಷ್ಠತೆ (0) ಮತ್ತು ವಿಷಯನಿಷ್ಠತೆ (1) ಕೂಡ ಅಳೆಯಲಾಗುತ್ತದೆ.

ಮತ್ತೆ ಜೇನ್ ಆಸ್ಟಿನ್ ಅವರ Pride and Prejudice ಅನ್ನು ನೋಡಿ. ಪಠ್ಯವನ್ನು Project Gutenberg ನಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಕೆಳಗಿನ ಉದಾಹರಣೆ ಒಂದು ಚಿಕ್ಕ ಕಾರ್ಯಕ್ರಮವನ್ನು ತೋರಿಸುತ್ತದೆ, ಇದು ಪುಸ್ತಕದ ಮೊದಲ ಮತ್ತು ಕೊನೆಯ ವಾಕ್ಯಗಳ ಭಾವನಾತ್ಮಕತೆಯನ್ನು ವಿಶ್ಲೇಷಿಸಿ ಅದರ ಪೋಲಾರಿಟಿ ಮತ್ತು ವಿಷಯನಿಷ್ಠೆ/ವಸ್ತುನಿಷ್ಠೆ ಅಂಕೆಯನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.

ನೀವು ಕೆಳಗಿನ ಕಾರ್ಯದಲ್ಲಿ TextBlob ಗ್ರಂಥಾಲಯವನ್ನು (ಮೇಲಿನ ವಿವರಣೆ ಪ್ರಕಾರ) sentiment ನಿರ್ಧರಿಸಲು ಬಳಸಬೇಕು (ನೀವು ನಿಮ್ಮದೇ ಭಾವನಾತ್ಮಕತೆ ಲೆಕ್ಕಿಸುವ ಯಂತ್ರವನ್ನು ಬರೆಯಬೇಕಾಗಿಲ್ಲ).

from textblob import TextBlob

quote1 = """It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife."""

quote2 = """Darcy, as well as Elizabeth, really loved them; and they were both ever sensible of the warmest gratitude towards the persons who, by bringing her into Derbyshire, had been the means of uniting them."""

sentiment1 = TextBlob(quote1).sentiment
sentiment2 = TextBlob(quote2).sentiment

print(quote1 + " has a sentiment of " + str(sentiment1))
print(quote2 + " has a sentiment of " + str(sentiment2))

ನೀವು ಕೆಳಗಿನ ಔಟ್‌ಪುಟ್ ಅನ್ನು ನೋಡುತ್ತೀರಿ:

It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want # of a wife. has a sentiment of Sentiment(polarity=0.20952380952380953, subjectivity=0.27142857142857146)

Darcy, as well as Elizabeth, really loved them; and they were
     both ever sensible of the warmest gratitude towards the persons
      who, by bringing her into Derbyshire, had been the means of
      uniting them. has a sentiment of Sentiment(polarity=0.7, subjectivity=0.8)

ಸವಾಲು - ಭಾವನಾತ್ಮಕ ಪೋಲಾರಿಟಿ ಪರಿಶೀಲನೆ

ನಿಮ್ಮ ಕಾರ್ಯವೆಂದರೆ, ಭಾವನಾತ್ಮಕ ಪೋಲಾರಿಟಿ ಬಳಸಿ, Pride and Prejudice ನಲ್ಲಿ ಸಂಪೂರ್ಣ ಧನಾತ್ಮಕ ವಾಕ್ಯಗಳು ಸಂಪೂರ್ಣ ನಕಾರಾತ್ಮಕ ವಾಕ್ಯಗಳಿಗಿಂತ ಹೆಚ್ಚು ಇದೆಯೇ ಎಂದು ನಿರ್ಧರಿಸುವುದು. ಈ ಕಾರ್ಯಕ್ಕಾಗಿ, ಪೋಲಾರಿಟಿ ಅಂಕೆ 1 ಅಥವಾ -1 ಅನ್ನು ಸಂಪೂರ್ಣ ಧನಾತ್ಮಕ ಅಥವಾ ಸಂಪೂರ್ಣ ನಕಾರಾತ್ಮಕ ಎಂದು ಪರಿಗಣಿಸಬಹುದು.

ಹಂತಗಳು:

  1. Project Gutenberg ನಿಂದ Pride and Prejudice ನ ಪ್ರತಿಯನ್ನು .txt ಫೈಲ್ ಆಗಿ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ. ಫೈಲ್ ಆರಂಭ ಮತ್ತು ಕೊನೆಯಲ್ಲಿ ಇರುವ ಮೆಟಾಡೇಟಾವನ್ನು ತೆಗೆದುಹಾಕಿ, ಮೂಲ ಪಠ್ಯವನ್ನು ಮಾತ್ರ ಉಳಿಸಿ
  2. ಫೈಲ್ ಅನ್ನು Python ನಲ್ಲಿ ತೆರೆಯಿರಿ ಮತ್ತು ವಿಷಯವನ್ನು ಸ್ಟ್ರಿಂಗ್ ಆಗಿ ತೆಗೆದುಕೊಳ್ಳಿ
  3. ಪುಸ್ತಕ ಸ್ಟ್ರಿಂಗ್ ಬಳಸಿ TextBlob ರಚಿಸಿ
  4. ಪುಸ್ತಕದ ಪ್ರತಿ ವಾಕ್ಯವನ್ನು ಲೂಪ್‌ನಲ್ಲಿ ವಿಶ್ಲೇಷಿಸಿ
    1. ಪೋಲಾರಿಟಿ 1 ಅಥವಾ -1 ಇದ್ದರೆ, ಆ ವಾಕ್ಯವನ್ನು ಧನಾತ್ಮಕ ಅಥವಾ ನಕಾರಾತ್ಮಕ ಸಂದೇಶಗಳ ಪಟ್ಟಿಯಲ್ಲಿ ಸಂಗ್ರಹಿಸಿ
  5. ಕೊನೆಯಲ್ಲಿ, ಎಲ್ಲಾ ಧನಾತ್ಮಕ ಮತ್ತು ನಕಾರಾತ್ಮಕ ವಾಕ್ಯಗಳನ್ನು (ಬೇರೆ ಬೇರೆ) ಮತ್ತು ಅವುಗಳ ಸಂಖ್ಯೆಯನ್ನು ಮುದ್ರಿಸಿ.

ಇಲ್ಲಿ ಒಂದು ಉದಾಹರಣೆಯ ಉತ್ತರ ಇದೆ.

✅ ಜ್ಞಾನ ಪರಿಶೀಲನೆ

  1. ಭಾವನಾತ್ಮಕತೆ ವಾಕ್ಯದಲ್ಲಿ ಬಳಸಿದ ಪದಗಳ ಆಧಾರದಲ್ಲಿ ಇರುತ್ತದೆ, ಆದರೆ ಕೋಡ್ ಪದಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತದೆಯೇ?
  2. ನೀವು ಭಾವನಾತ್ಮಕ ಪೋಲಾರಿಟಿ ನಿಖರವಾಗಿದೆ ಎಂದು ಭಾವಿಸುತ್ತೀರಾ, ಅಥವಾ ಬೇರೆ ಪದಗಳಲ್ಲಿ, ಅಂಕೆಗಳಿಗೆ ನೀವು ಒಪ್ಪುತ್ತೀರಾ?
    1. ವಿಶೇಷವಾಗಿ, ಕೆಳಗಿನ ವಾಕ್ಯಗಳ ಸಂಪೂರ್ಣ ಧನಾತ್ಮಕ ಪೋಲಾರಿಟಿಗೆ ನೀವು ಒಪ್ಪುತ್ತೀರಾ ಅಥವಾ ವಿರೋಧಿಸುತ್ತೀರಾ?
      • “What an excellent father you have, girls!” said she, when the door was shut.
      • “Your examination of Mr. Darcy is over, I presume,” said Miss Bingley; “and pray what is the result?” “I am perfectly convinced by it that Mr. Darcy has no defect.
      • How wonderfully these sort of things occur!
      • I have the greatest dislike in the world to that sort of thing.
      • Charlotte is an excellent manager, I dare say.
      • “This is delightful indeed!
      • I am so happy!
      • Your idea of the ponies is delightful.
    2. ಮುಂದಿನ 3 ವಾಕ್ಯಗಳನ್ನು ಸಂಪೂರ್ಣ ಧನಾತ್ಮಕ ಭಾವನಾತ್ಮಕತೆ ಪಡೆದಿವೆ, ಆದರೆ ನಿಕಟ ಓದಿನಲ್ಲಿ ಅವು ಧನಾತ್ಮಕ ವಾಕ್ಯಗಳಲ್ಲ. ಭಾವನಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ ಅವುಗಳನ್ನು ಧನಾತ್ಮಕ ಎಂದು ಯಾಕೆ ಭಾವಿಸಿತು?
      • Happy shall I be, when his stay at Netherfield is over!” “I wish I could say anything to comfort you,” replied Elizabeth; “but it is wholly out of my power.
      • If I could but see you as happy!
      • Our distress, my dear Lizzy, is very great.
    3. ಕೆಳಗಿನ ವಾಕ್ಯಗಳ ಸಂಪೂರ್ಣ ನಕಾರಾತ್ಮಕ ಪೋಲಾರಿಟಿಗೆ ನೀವು ಒಪ್ಪುತ್ತೀರಾ ಅಥವಾ ವಿರೋಧಿಸುತ್ತೀರಾ?
      • Everybody is disgusted with his pride.
      • “I should like to know how he behaves among strangers.” “You shall hear then—but prepare yourself for something very dreadful.
      • The pause was to Elizabeth’s feelings dreadful.
      • It would be dreadful!

✅ ಜೇನ್ ಆಸ್ಟಿನ್ ಅವರ ಅಭಿಮಾನಿಗಳು ತಿಳಿದುಕೊಳ್ಳುತ್ತಾರೆ ಅವರು ತಮ್ಮ ಪುಸ್ತಕಗಳಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ರೆಜೆನ್ಸಿ ಸಮಾಜದ ಅತಿವಾದ ಅಂಶಗಳನ್ನು ವಿಮರ್ಶಿಸುವುದನ್ನು. Pride and Prejudice ನ ಪ್ರಮುಖ ಪಾತ್ರ ಎಲಿಜಬೆತ್ ಬೆನೆಟ್ (ಲೇಖಕನಂತೆ) ಸಾಮಾಜಿಕ ವೀಕ್ಷಕಳು ಮತ್ತು ಅವಳ ಭಾಷೆ ಬಹಳ ಸೂಕ್ಷ್ಮವಾಗಿದೆ. ಕಥೆಯ ಪ್ರೇಮ ಸಂಬಂಧಿ ಮಿಸ್ಟರ್ ಡಾರ್ಸಿ ಕೂಡ ಎಲಿಜಬೆತ್ ಅವರ ಆಟದ ಮತ್ತು ಹಾಸ್ಯಾಸ್ಪದ ಭಾಷಾ ಬಳಕೆಯನ್ನು ಗಮನಿಸುತ್ತಾನೆ: "ನಾನು ನಿಮ್ಮ ಪರಿಚಯವನ್ನು ಸಾಕಷ್ಟು ಕಾಲ ಹೊಂದಿದ್ದೇನೆ, ನೀವು ಕೆಲವೊಮ್ಮೆ ನಿಮ್ಮದೇ ಅಲ್ಲದ ಅಭಿಪ್ರಾಯಗಳನ್ನು ಪ್ರೊಫೆಸ್ಸ್ ಮಾಡುವುದರಲ್ಲಿ ದೊಡ್ಡ ಆನಂದವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೀರಿ."


🚀ಸವಾಲು

ಮಾರ್ವಿನ್ ಅನ್ನು ಬಳಕೆದಾರ ಇನ್ಪುಟ್‌ನಿಂದ ಇತರ ಲಕ್ಷಣಗಳನ್ನು ಹೊರತೆಗೆಯುವ ಮೂಲಕ ಇನ್ನೂ ಉತ್ತಮಗೊಳಿಸಬಹುದೇ?

ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ

ಪಠ್ಯದಿಂದ ಭಾವನೆಯನ್ನು ಹೊರತೆಗೆಯಲು ಅನೇಕ ವಿಧಾನಗಳಿವೆ. ಈ ತಂತ್ರವನ್ನು ಬಳಸಬಹುದಾದ ವ್ಯವಹಾರಿಕ ಅನ್ವಯಗಳನ್ನು ಯೋಚಿಸಿ. ಇದು ಹೇಗೆ ತಪ್ಪು ಹೋಗಬಹುದು ಎಂದು ಯೋಚಿಸಿ. Azure Text Analysis ಮುಂತಾದ ಭಾವನೆಯನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಸುಧಾರಿತ ಉದ್ಯಮ-ಸಿದ್ಧ ವ್ಯವಸ್ಥೆಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ಓದಿ. ಮೇಲಿನ ಪ್ರೈಡ್ ಮತ್ತು ಪ್ರಿಜುಡಿಸ್ ವಾಕ್ಯಗಳನ್ನು ಕೆಲವು ಪರೀಕ್ಷಿಸಿ ಮತ್ತು ಇದು ಸೂಕ್ಷ್ಮತೆಯನ್ನು ಪತ್ತೆಹಚ್ಚಬಹುದೇ ಎಂದು ನೋಡಿ.

ನಿಯೋಜನೆ

Poetic license


ಅಸ್ವೀಕಾರ:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ Co-op Translator ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.