File CrossRef.java

Branches:

184

Statements:

288

Methods:

Classes:

LOC:

1,126

NCLOC:

654

Total complexity:

137

Complexity density:

0.48

Statements/Method:

Methods/Class:

Average method complexity:

8.56

Classes

Class	Line #	Total Statements	Complexity	TOTAL Coverage	Actions
CrossRef	47	288	137	0.4631147746.3%

Class CrossRef

Class CrossRef	Line # 47	Total Statements 288	Complexity 137	TOTAL Coverage 0.4631147746.3%
CrossRef(SequenceI[],AlignmentI) CrossRef(SequenceI[],AlignmentI)	8080	2.02	2.02	0.75 0.7575%
findXrefSourcesForSequences(boolean) : List<String> findXrefSourcesForSequences(boolean) : List<String>	100100	9.09	3.03	0.9230769 0.923076992.3%
findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void	140140	9.09	2.02	0.90909094 0.9090909490.9%
addXrefsToSources(List<DBRefEntry>,List<String>) : void addXrefsToSources(List<DBRefEntry>,List<String>) : void	183183	5.05	3.03	1.0 1.0100%
findXrefSequences(String,boolean) : Alignment findXrefSequences(String,boolean) : Alignment	220220	58.058	31.031	0.82 0.8282%
retrieveCrossRef(List<DBRefEntry>,SequenceI,List<DBRefEntry>,boolean,AlignedCodonFrame) : void retrieveCrossRef(List<DBRefEntry>,SequenceI,List<DBRefEntry>,boolean,AlignedCodonFrame) : void	405405	25.025	10.010	0.0 0.00%
removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void	491491	16.016	6.06	0.0 0.00%
equals(Object) : boolean equals(Object) : boolean	653653	1.01	1.01	0.0 0.00%
importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean	537537	47.047	16.016	0.0 0.00%
setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void	697697	12.012	6.06	0.0 0.00%
findInDataset(DBRefEntry) : SequenceI findInDataset(DBRefEntry) : SequenceI	737737	18.018	13.013	0.7 0.770%
sameSequence(SequenceI,SequenceI) : boolean sameSequence(SequenceI,SequenceI) : boolean	796796	12.012	9.09	0.90909094 0.9090909490.9%
updateDbrefMappings(SequenceI,List<DBRefEntry>,SequenceI[],AlignedCodonFrame,boolean) : void updateDbrefMappings(SequenceI,List<DBRefEntry>,SequenceI[],AlignedCodonFrame,boolean) : void	837837	9.09	3.03	0.0 0.00%
constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean	880880	24.024	12.012	0.0 0.00%
searchDatasetXrefs(boolean,SequenceI,List<DBRefEntry>,List<SequenceI>,AlignedCodonFrame) : boolean searchDatasetXrefs(boolean,SequenceI,List<DBRefEntry>,List<SequenceI>,AlignedCodonFrame) : boolean	970970	6.06	3.03	1.0 1.0100%
searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean,int) : boolean searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean,int) : boolean	10211021	35.035	17.017	0.8196721 0.819672182%

Contributing tests

This file is covered by 187 tests. .

Contributing tests

Test contribution	Test	Result
0.34836066	jalview.io.CrossRef2xmlTests.openCrossrefsForEnsemblTwicejalview.io.CrossRef2xmlTests.openCrossrefsForEnsemblTwice	1PASS
0.1659836	jalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMapjalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMap	1PASS
0.16188525	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotidejalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotide	1PASS
0.16188525	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProteinjalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProtein	1PASS
0.14344262	jalview.project.Jalview2xmlTests.testStoreAndRecoverGeneLocusjalview.project.Jalview2xmlTests.testStoreAndRecoverGeneLocus	1PASS
0.13729508	jalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDnajalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDna	1PASS
0.12704918	jalview.project.Jalview2xmlTests.testRNAStructureRecoveryjalview.project.Jalview2xmlTests.testRNAStructureRecovery	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettingsjalview.project.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettings	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testStoreAndRecoverExpandedviewsjalview.project.Jalview2xmlTests.testStoreAndRecoverExpandedviews	1PASS
0.12295082	jalview.project.Jalview2xmlTests.gatherViewsHerejalview.project.Jalview2xmlTests.gatherViewsHere	1PASS
0.12295082	jalview.project.Jalview2xmlTests.noDuplicatePdbMappingsMadejalview.project.Jalview2xmlTests.noDuplicatePdbMappingsMade	1PASS
0.12295082	jalview.project.Jalview2xmlTests.viewRefPdbAnnotationjalview.project.Jalview2xmlTests.viewRefPdbAnnotation	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testCopyViewSettingsjalview.project.Jalview2xmlTests.testCopyViewSettings	1PASS
0.1045082	jalview.analysis.CrossRefTest.testSearchDatasetjalview.analysis.CrossRefTest.testSearchDataset	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06967213	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06967213	jalview.renderer.seqfeatures.FeatureRendererTest.testFindComplementFeaturesAtResiduejalview.renderer.seqfeatures.FeatureRendererTest.testFindComplementFeaturesAtResidue	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06967213	jalview.bin.CommandsTest.allLinkedIdsTestjalview.bin.CommandsTest.allLinkedIdsTest	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrandjalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrand	1PASS
0.06762295	jalview.io.BackupFilesTest.noBackupsEnabledTestjalview.io.BackupFilesTest.noBackupsEnabledTest	1PASS
0.06762295	jalview.io.BackupFilesTest.backupsEnabledReverseRollMaxTestjalview.io.BackupFilesTest.backupsEnabledReverseRollMaxTest	1PASS
0.06762295	jalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTestjalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTest	1PASS
0.06762295	jalview.gui.AlignViewportTest.testDeregisterMapping_onCloseViewjalview.gui.AlignViewportTest.testDeregisterMapping_onCloseView	1PASS
0.06762295	jalview.gui.ColourMenuHelperTest.testAddMenuItems_nucleotidejalview.gui.ColourMenuHelperTest.testAddMenuItems_nucleotide	1PASS
0.06762295	jalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.06762295	jalview.io.BackupFilesTest.backupsEnabledNoRollMaxTestjalview.io.BackupFilesTest.backupsEnabledNoRollMaxTest	1PASS
0.06762295	jalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTestjalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTest	1PASS
0.06762295	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06762295	jalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTestjalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTest	1PASS
0.06762295	jalview.io.BackupFilesTest.backupsEnabledRollMaxTestjalview.io.BackupFilesTest.backupsEnabledRollMaxTest	1PASS
0.06762295	jalview.io.BackupFilesTest.backupsEnabledSingleFileBackupTestjalview.io.BackupFilesTest.backupsEnabledSingleFileBackupTest	1PASS
0.06762295	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scales_longSequencejalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scales_longSequence	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoadjalview.io.vcf.VCFLoaderTest.testDoLoad	1PASS
0.06762295	jalview.gui.AlignViewportTest.testGetSelectionAsNewSequences_withContactMatricesjalview.gui.AlignViewportTest.testGetSelectionAsNewSequences_withContactMatrices	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsqjalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsq	1PASS
0.06762295	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeaturejalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeature	1PASS
0.06352459	jalview.gui.AlignViewportTest.testDeregisterMapping_withNoReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withNoReference	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageOutputTestjalview.bin.CommandsTest.structureImageOutputTest	1PASS
0.06352459	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumnjalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumn	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRestoreIDwidthAndAnnotationHeightjalview.project.Jalview2xmlTests.testStoreAndRestoreIDwidthAndAnnotationHeight	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_annotationsjalview.gui.SeqPanelTest.testFindMousePosition_wrapped_annotations	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testTCoffeeScoresjalview.project.Jalview2xmlTests.testTCoffeeScores	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistancesjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances	1PASS
0.06352459	jalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNonejalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNone	1PASS
0.06352459	jalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePositionjalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePosition	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModeljalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel	1PASS
0.06352459	jalview.schemes.ColourSchemesTest.testRegisterColourSchemejalview.schemes.ColourSchemesTest.testRegisterColourScheme	1PASS
0.06352459	jalview.gui.AlignFrameTest.testNewView_dsRefPreservedjalview.gui.AlignFrameTest.testNewView_dsRefPreserved	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testGetColourjalview.renderer.seqfeatures.FeatureRendererTest.testGetColour	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintJalviewFormatjalview.io.FeaturesFileTest.testPrintJalviewFormat	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnlyjalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnly	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testUnsavedChangesjalview.gui.QuitHandlerTest.testUnsavedChanges	1PASS
0.06352459	jalview.gui.AlignmentPanelTest.testSetOverviewTitle_automaticOverviewjalview.gui.AlignmentPanelTest.testSetOverviewTitle_automaticOverview	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.schemes.ColourSchemesTest.testGetColourSchemejalview.schemes.ColourSchemesTest.testGetColourScheme	1PASS
0.06352459	jalview.datamodel.AlignmentViewTest.testGetVisibleContigsjalview.datamodel.AlignmentViewTest.testGetVisibleContigs	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scaleAbovejalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scaleAbove	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testSaveLoadFeatureColoursAndFiltersjalview.project.Jalview2xmlTests.testSaveLoadFeatureColoursAndFilters	1PASS
0.06352459	jalview.structures.models.AAStructureBindingModelTest.testBuildColoursMapjalview.structures.models.AAStructureBindingModelTest.testBuildColoursMap	1PASS
0.06352459	jalview.gui.ScalePanelTest.testSelectColumns_withHiddenjalview.gui.ScalePanelTest.testSelectColumns_withHidden	1PASS
0.06352459	jalview.gui.AlignViewportTest.testShowOrDontShowOccupancyjalview.gui.AlignViewportTest.testShowOrDontShowOccupancy	1PASS
0.06352459	jalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withGapjalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withGap	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetGlobalColourSchemejalview.gui.AlignViewportTest.testSetGlobalColourScheme	1PASS
0.06352459	jalview.io.JalviewExportPropertiesTests.testImportExportPeriodGapsjalview.io.JalviewExportPropertiesTests.testImportExportPeriodGaps	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testMergeDatasetsforManyViewsjalview.project.Jalview2xmlTests.testMergeDatasetsforManyViews	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.gui.AlignViewportTest.testDeregisterMapping_withReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withReference	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testInstantQuitjalview.gui.QuitHandlerTest.testInstantQuit	1PASS
0.06352459	jalview.controller.AlignViewControllerTest.testFindColumnsWithFeaturejalview.controller.AlignViewControllerTest.testFindColumnsWithFeature	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testPcaViewAssociationjalview.project.Jalview2xmlTests.testPcaViewAssociation	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintGffFormatjalview.io.FeaturesFileTest.testPrintGffFormat	1PASS
0.06352459	jalview.gui.AlignViewportTest.testUpdateConservation_qualityOnlyjalview.gui.AlignViewportTest.testUpdateConservation_qualityOnly	1PASS
0.06352459	jalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.06352459	jalview.gui.AlignViewportTest.testGetConsensusSeqjalview.gui.AlignViewportTest.testGetConsensusSeq	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumnsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumns	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_mixedJalviewGffjalview.io.FeaturesFileTest.testParse_mixedJalviewGff	1PASS
0.06352459	jalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withSSUndefinedInBothSeqsjalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withSSUndefinedInBothSeqs	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetSelectionGroupjalview.gui.AlignViewportTest.testSetSelectionGroup	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverAnnotationRowElementColoursjalview.project.Jalview2xmlTests.testStoreAndRecoverAnnotationRowElementColours	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testForceQuitjalview.gui.QuitHandlerTest.testForceQuit	1PASS
0.06352459	jalview.gui.AlignFrameTest.testNewView_colourThresholdsjalview.gui.AlignFrameTest.testNewView_colourThresholds	1PASS
0.06352459	jalview.gui.AnnotationLabelsTest2.testIdWidthChangesjalview.gui.AnnotationLabelsTest2.testIdWidthChanges	1PASS
0.06352459	jalview.gui.ScalePanelTest.testBuildPopupMenujalview.gui.ScalePanelTest.testBuildPopupMenu	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeaturesjalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeatures	1PASS
0.06352459	jalview.schemes.ClustalxColourSchemeTest.testFindColourjalview.schemes.ClustalxColourSchemeTest.testFindColour	1PASS
0.06352459	jalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessagejalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessage	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageOutputTestjalview.bin.CommandsTest.structureImageOutputTest	1PASS
0.06352459	jalview.io.WindowsFileLoadAndSaveTest.loadAndSaveAlignmentjalview.io.WindowsFileLoadAndSaveTest.loadAndSaveAlignment	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testAutoShowOverviewForLegacyProjectsjalview.project.Jalview2xmlTests.testAutoShowOverviewForLegacyProjects	1PASS
0.06352459	jalview.io.JSONFileTest.testGrpParsed_colourNonejalview.io.JSONFileTest.testGrpParsed_colourNone	1PASS
0.06352459	jalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignmentjalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignment	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testWaitForSaveQuitjalview.gui.QuitHandlerTest.testWaitForSaveQuit	1PASS
0.06352459	jalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withSSUndefinedInEitherOneSeqjalview.analysis.scoremodels.SecondaryStructureDistanceModelTest.testFindDistances_withSSUndefinedInEitherOneSeq	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverPDBEntryjalview.project.Jalview2xmlTests.testStoreAndRecoverPDBEntry	1PASS
0.06352459	jalview.gui.ScalePanelTest.testPreventNegativeStartColumnjalview.gui.ScalePanelTest.testPreventNegativeStartColumn	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverColourThresholdsjalview.project.Jalview2xmlTests.testStoreAndRecoverColourThresholds	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_noAnnotationsjalview.gui.SeqPanelTest.testFindMousePosition_wrapped_noAnnotations	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParsejalview.io.FeaturesFileTest.testParse	1PASS
0.06352459	jalview.gui.DesktopTests.testInternalCopyPastejalview.gui.DesktopTests.testInternalCopyPaste	1PASS
0.06352459	jalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotationjalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotation	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testMergeDatasetsforViewsjalview.project.Jalview2xmlTests.testMergeDatasetsforViews	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testSavedProjectChangesjalview.gui.QuitHandlerTest.testSavedProjectChanges	1PASS
0.06352459	jalview.renderer.ScaleRendererTest.testCalculateMarksjalview.renderer.ScaleRendererTest.testCalculateMarks	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverNoOverviewjalview.project.Jalview2xmlTests.testStoreAndRecoverNoOverview	1PASS
0.06352459	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroup	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testPAEsaveRestorejalview.project.Jalview2xmlTests.testPAEsaveRestore	1PASS
0.06352459	jalview.io.gff.GffTests.testResolveExonerateGffjalview.io.gff.GffTests.testResolveExonerateGff	1PASS
0.06352459	jalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMol	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlightjalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlight	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqsjalview.project.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqs	1PASS
0.06352459	jalview.gui.AlignmentPanelTest.testSetOverviewTitlejalview.gui.AlignmentPanelTest.testSetOverviewTitle	1PASS
0.06352459	jalview.ext.jmol.JmolParserTest.testAlignmentLoaderjalview.ext.jmol.JmolParserTest.testAlignmentLoader	1PASS
0.06352459	jalview.gui.PaintRefresherTest.testGetAssociatedPanelsjalview.gui.PaintRefresherTest.testGetAssociatedPanels	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.gui.AnnotationLabelsTest2.testIdWidthNoChangesjalview.gui.AnnotationLabelsTest2.testIdWidthNoChanges	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.gui.ColourMenuHelperTest.testAddMenuItems_forAlignFramejalview.gui.ColourMenuHelperTest.testAddMenuItems_forAlignFrame	1PASS
0.06352459	jalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTestjalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTest	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetGetHasSearchResultsjalview.gui.AlignViewportTest.testSetGetHasSearchResults	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverOverviewjalview.project.Jalview2xmlTests.testStoreAndRecoverOverview	1PASS
0.06352459	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroup	1PASS
0.06352459	jalview.bin.CommandsTest2.structureOpeningArgsTestjalview.bin.CommandsTest2.structureOpeningArgsTest	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.io.AnnotationFileIOTest.testAnnotateAlignmentViewjalview.io.AnnotationFileIOTest.testAnnotateAlignmentView	1PASS
0.06352459	jalview.gui.AnnotationLabelsTest2.testIdWidthNoChangesjalview.gui.AnnotationLabelsTest2.testIdWidthNoChanges	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParamsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParams	1PASS
0.06352459	jalview.analysis.AverageDistanceEngineTest.testUPGMAEnginejalview.analysis.AverageDistanceEngineTest.testUPGMAEngine	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_pureGff3jalview.io.FeaturesFileTest.testParse_pureGff3	1PASS
0.06352459	jalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMol	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintJalviewFormat_withFiltersjalview.io.FeaturesFileTest.testPrintJalviewFormat_withFilters	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageOutputTestjalview.bin.CommandsTest.structureImageOutputTest	1PASS
0.06352459	jalview.gui.AlignFrameTest.testHideFeatureColumnsjalview.gui.AlignFrameTest.testHideFeatureColumns	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testIsVisiblejalview.renderer.seqfeatures.FeatureRendererTest.testIsVisible	1PASS
0.06352459	jalview.io.FeaturesFileTest.simpleGff3FileLoaderjalview.io.FeaturesFileTest.simpleGff3FileLoader	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindColumn_and_FindAlignmentColumn_wrappedjalview.gui.SeqPanelTest.testFindColumn_and_FindAlignmentColumn_wrapped	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testColourByAnnotScoresjalview.project.Jalview2xmlTests.testColourByAnnotScores	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.gui.StructureChooserTest.openStructureFileForSequenceTestjalview.gui.StructureChooserTest.openStructureFileForSequenceTest	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumnjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumn	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testSavedAlignmentChangesjalview.gui.QuitHandlerTest.testSavedAlignmentChanges	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintGffFormat_withFiltersjalview.io.FeaturesFileTest.testPrintGffFormat_withFilters	1PASS
0.06352459	jalview.bin.CommandsTest.commandsOpenTestjalview.bin.CommandsTest.commandsOpenTest	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindColumn_unwrappedjalview.gui.SeqPanelTest.testFindColumn_unwrapped	1PASS
0.06352459	jalview.gui.FeatureSettingsTest.testSaveLoadjalview.gui.FeatureSettingsTest.testSaveLoad	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageAnnotationsOutputTestjalview.bin.CommandsTest.structureImageAnnotationsOutputTest	1PASS
0.06352459	jalview.gui.QuitHandlerTest.testNoGUIUnsavedChangesjalview.gui.QuitHandlerTest.testNoGUIUnsavedChanges	1PASS
0.06352459	jalview.io.AnnotationExporterTest.testAnnotationExportAsCSVjalview.io.AnnotationExporterTest.testAnnotationExportAsCSV	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplayjalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplay	1PASS
0.06352459	jalview.gui.AnnotationLabelsTest2.testIdWidthChangesjalview.gui.AnnotationLabelsTest2.testIdWidthChanges	1PASS
0.06352459	jalview.bin.CommandsTest.structureImageOutputTestjalview.bin.CommandsTest.structureImageOutputTest	1PASS
0.06352459	jalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTestjalview.bin.CommandsTest.argFilesGlobAndSubstitutionsTest	1PASS
0.06147541	jalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefsjalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefs	1PASS
0.043032788	jalview.analysis.CrossRefTest.testSameSequencejalview.analysis.CrossRefTest.testSameSequence	1PASS

Source view

* Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)

* Copyright (C) $$Year-Rel$$ The Jalview Authors

* This file is part of Jalview.

* Jalview is free software: you can redistribute it and/or

* modify it under the terms of the GNU General Public License

* as published by the Free Software Foundation, either version 3

* of the License, or (at your option) any later version.

* Jalview is distributed in the hope that it will be useful, but

* WITHOUT ANY WARRANTY; without even the implied warranty

* of MERCHANTABILITY or FITNESS FOR A PARTICULAR

* PURPOSE. See the GNU General Public License for more details.

* You should have received a copy of the GNU General Public License

* along with Jalview. If not, see <http://www.gnu.org/licenses/>.

* The Jalview Authors are detailed in the 'AUTHORS' file.

package jalview.analysis;

import jalview.datamodel.AlignedCodonFrame;

import jalview.datamodel.Alignment;

import jalview.datamodel.AlignmentI;

import jalview.datamodel.DBRefEntry;

import jalview.datamodel.DBRefSource;

import jalview.datamodel.Mapping;

import jalview.datamodel.Sequence;

import jalview.datamodel.SequenceFeature;

import jalview.datamodel.SequenceI;

import jalview.util.DBRefUtils;

import jalview.util.MapList;

import jalview.ws.SequenceFetcherFactory;

import jalview.ws.seqfetcher.ASequenceFetcher;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

/**

* Functions for cross-referencing sequence databases.

* @author JimP

public class CrossRef

{

* the dataset of the alignment for which we are searching for

* cross-references; in some cases we may resolve xrefs by

* searching in the dataset

private AlignmentI dataset;

* the sequences for which we are seeking cross-references

private SequenceI[] fromSeqs;

/**

* matcher built from dataset

SequenceIdMatcher matcher;

/**

* sequences found by cross-ref searches to fromSeqs

List<SequenceI> rseqs;

/**

* Constructor

* @param seqs

* the sequences for which we are seeking cross-references

* @param ds

* the containing alignment dataset (may be searched to resolve

* cross-references)

683

public CrossRef(SequenceI[] seqs, AlignmentI ds)

{

683

fromSeqs = seqs;

683

dataset = ds.getDataset() == null ? ds : ds.getDataset();

}

/**

* Returns a list of distinct database sources for which sequences have either

* <ul>

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

* reference from another sequence in the dataset which has a cross-reference

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param dna

* - when true, cross-references *from* dna returned. When false,

* cross-references *from* protein are returned

* @return

100

676

public List<String> findXrefSourcesForSequences(boolean dna)

101

{

102

676

List<String> sources = new ArrayList<>();

103

676

for (SequenceI seq : fromSeqs)

104

{

105

6699

if (seq != null)

106

{

107

6699

findXrefSourcesForSequence(seq, dna, sources);

108

}

109

}

110

676

sources.remove(DBRefSource.EMBL); // hack to prevent EMBL xrefs resulting in

111

// redundant datasets

112

676

if (dna)

113

{

114

sources.remove(DBRefSource.ENSEMBL); // hack to prevent Ensembl and

115

// EnsemblGenomes xref option shown

116

// from cdna panel

117

sources.remove(DBRefSource.ENSEMBLGENOMES);

118

}

119

// redundant datasets

120

676

return sources;

}

/**

* Returns a list of distinct database sources for which a sequence has either

125

* <ul>

126

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

127

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

128

* reference from another sequence in the dataset which has a cross-reference

129

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param seq

* the sequence whose dbrefs we are searching against

134

* @param fromDna

135

* when true, context is DNA - so sources identifying protein

136

* products will be returned.

137

* @param sources

138

* a list of sources to add matches to

139

140

6699

void findXrefSourcesForSequence(SequenceI seq, boolean fromDna,

141

List<String> sources)

142

{

143

144

* first find seq's xrefs (dna-to-peptide or peptide-to-dna)

145

146

6699

List<DBRefEntry> rfs = DBRefUtils.selectDbRefs(!fromDna,

147

seq.getDBRefs());

148

6699

addXrefsToSources(rfs, sources);

149

6699

if (dataset != null)

150

{

151

152

* find sequence's direct (dna-to-dna, peptide-to-peptide) xrefs

153

154

6699

List<DBRefEntry> lrfs = DBRefUtils.selectDbRefs(fromDna,

155

seq.getDBRefs());

156

6699

List<SequenceI> foundSeqs = new ArrayList<>();

157

158

159

* find sequences in the alignment which xref one of these DBRefs

160

* i.e. is xref-ed to a common sequence identifier

161

162

6699

searchDatasetXrefs(fromDna, seq, lrfs, foundSeqs, null);

163

164

165

* add those sequences' (dna-to-peptide or peptide-to-dna) dbref sources

166

167

6699

for (SequenceI rs : foundSeqs)

168

{

169

272

List<DBRefEntry> xrs = DBRefUtils.selectDbRefs(!fromDna,

170

rs.getDBRefs());

171

272

addXrefsToSources(xrs, sources);

}

}

}

/**

* Helper method that adds the source identifiers of some cross-references to

178

* a (non-redundant) list of database sources

* @param xrefs

* @param sources

6971

void addXrefsToSources(List<DBRefEntry> xrefs, List<String> sources)

184

{

185

6971

if (xrefs != null)

186

{

187

364

for (DBRefEntry ref : xrefs)

188

{

189

190

* avoid duplication e.g. ENSEMBL and Ensembl

191

192

1358

String source = DBRefUtils.getCanonicalName(ref.getSource());

193

1358

if (!sources.contains(source))

{

sources.add(source);

}

}

}

}

/**

* Attempts to find cross-references from the sequences provided in the

203

* constructor to the given source database. Cross-references may be found

204

* <ul>

205

* <li>in dbrefs on the sequence which hold a mapping to a sequence

206

* <ul>

207

* <li>provided with a fetched sequence (e.g. ENA translation), or</li>

208

* <li>populated previously after getting cross-references</li>

209

* </ul>

210

* <li>as other sequences in the alignment which share a dbref identifier with

211

* the sequence</li>

212

* <li>by fetching from the remote database</li>

213

* </ul>

214

* The cross-referenced sequences, and mappings to them, are added to the

* alignment dataset.

* @param source

* @return cross-referenced sequences (as dataset sequences)

219

220

public Alignment findXrefSequences(String source, boolean fromDna)

221

{

222

223

rseqs = new ArrayList<>();

224

AlignedCodonFrame cf = new AlignedCodonFrame();

225

matcher = new SequenceIdMatcher(dataset.getSequences());

226

227

for (SequenceI seq : fromSeqs)

228

{

229

SequenceI dss = seq;

230

while (dss.getDatasetSequence() != null)

231

{

232

dss = dss.getDatasetSequence();

233

}

234

boolean found = false;

235

List<DBRefEntry> xrfs = DBRefUtils.selectDbRefs(!fromDna,

236

dss.getDBRefs());

237

// ENST & ENSP comes in to both Protein and nucleotide, so we need to

238

// filter them

239

// out later.

240

if ((xrfs == null || xrfs.size() == 0) && dataset != null)

241

{

242

243

* found no suitable dbrefs on sequence - look for sequences in the

244

* alignment which share a dbref with this one

245

246

List<DBRefEntry> lrfs = DBRefUtils.selectDbRefs(fromDna,

seq.getDBRefs());

* find sequences (except this one!), of complementary type,

251

* which have a dbref to an accession id for this sequence,

252

* and add them to the results

253

254

found = searchDatasetXrefs(fromDna, dss, lrfs, rseqs, cf);

255

}

256

if (xrfs == null && !found)

257

{

258

259

* no dbref to source on this sequence or matched

260

* complementary sequence in the dataset

continue;

}

List<DBRefEntry> sourceRefs = DBRefUtils.searchRefsForSource(xrfs,

265

source);

266

Iterator<DBRefEntry> refIterator = sourceRefs.iterator();

267

// At this point, if we are retrieving Ensembl, we still don't filter out

268

// ENST when looking for protein crossrefs.

269

while (refIterator.hasNext())

270

{

271

DBRefEntry xref = refIterator.next();

272

found = false;

273

// we're only interested in coding cross-references, not

274

// locus->transcript

275

if (xref.hasMap() && xref.getMap().getMap().isTripletMap())

276

{

277

SequenceI mappedTo = xref.getMap().getTo();

278

if (mappedTo != null)

279

{

280

281

* dbref contains the sequence it maps to; add it to the

282

* results unless we have done so already (could happen if

283

* fetching xrefs for sequences which have xrefs in common)

284

* for example: UNIPROT {P0CE19, P0CE20} -> EMBL {J03321, X06707}

found = true;

* problem: matcher.findIdMatch() is lenient - returns a sequence

289

* with a dbref to the search arg e.g. ENST for ENSP - wrong

290

* but findInDataset() matches ENSP when looking for Uniprot...

291

292

SequenceI matchInDataset = findInDataset(xref);

293

if (matchInDataset != null && xref.getMap().getTo() != null

294

&& matchInDataset != xref.getMap().getTo())

295

{

296

jalview.bin.Console.errPrintln(

297

"Implementation problem (reopen JAL-2154): CrossRef.findInDataset seems to have recovered a different sequence than the one explicitly mapped for xref."

298

+ "Found:" + matchInDataset + "\nExpected:"

299

+ xref.getMap().getTo() + "\nFor xref:"

300

+ xref);

301

}

302

/*matcher.findIdMatch(mappedTo);*/

303

if (matchInDataset != null)

304

{

305

if (!rseqs.contains(matchInDataset))

306

{

307

rseqs.add(matchInDataset);

308

}

309

// even if rseqs contained matchInDataset - check mappings between

310

// these seqs are added

311

// need to try harder to only add unique mappings

312

if (xref.getMap().getMap().isTripletMap()

313

&& dataset.getMapping(seq, matchInDataset) == null

314

&& cf.getMappingBetween(seq, matchInDataset) == null)

315

{

316

// materialise a mapping for highlighting between these

// sequences

if (fromDna)

{

cf.addMap(dss, matchInDataset, xref.getMap().getMap(),

321

xref.getMap().getMappedFromId());

}

else

{

cf.addMap(matchInDataset, dss,

326

xref.getMap().getMap().getInverse(),

327

xref.getMap().getMappedFromId());

}

}

refIterator.remove();

332

continue;

333

}

334

// TODO: need to determine if this should be a deriveSequence

335

SequenceI rsq = new Sequence(mappedTo);

336

rseqs.add(rsq);

337

if (xref.getMap().getMap().isTripletMap())

338

{

339

// get sense of map correct for adding to product alignment.

340

if (fromDna)

341

{

342

// map is from dna seq to a protein product

343

cf.addMap(dss, rsq, xref.getMap().getMap(),

344

xref.getMap().getMappedFromId());

}

else

{

// map should be from protein seq to its coding dna

349

cf.addMap(rsq, dss, xref.getMap().getMap().getInverse(),

350

xref.getMap().getMappedFromId());

}

}

}

}

if (!found)

{

SequenceI matchedSeq = matcher.findIdMatch(

359

xref.getSource() + "|" + xref.getAccessionId());

360

// if there was a match, check it's at least the right type of

361

// molecule!

362

if (matchedSeq != null && matchedSeq.isProtein() == fromDna)

363

{

364

if (constructMapping(seq, matchedSeq, xref, cf, fromDna))

{

found = true;

}

}

}

if (!found)

{

// do a bit more work - search for sequences with references matching

374

// xrefs on this sequence.

375

found = searchDataset(fromDna, dss, xref, rseqs, cf, false,

376

DBRefUtils.SEARCH_MODE_FULL);

}

if (found)

{

refIterator.remove();

}

}

* fetch from source database any dbrefs we haven't resolved up to here

386

387

if (!sourceRefs.isEmpty())

388

{

389

retrieveCrossRef(sourceRefs, seq, xrfs, fromDna, cf);

}

}

Alignment ral = null;

394

if (rseqs.size() > 0)

395

{

396

ral = new Alignment(rseqs.toArray(new SequenceI[rseqs.size()]));

397

if (!cf.isEmpty())

398

{

399

dataset.addCodonFrame(cf);

}

}

return ral;

}

private void retrieveCrossRef(List<DBRefEntry> sourceRefs, SequenceI seq,

406

List<DBRefEntry> xrfs, boolean fromDna, AlignedCodonFrame cf)

407

{

408

ASequenceFetcher sftch = SequenceFetcherFactory.getSequenceFetcher();

409

SequenceI[] retrieved = null;

410

SequenceI dss = seq.getDatasetSequence() == null ? seq

411

: seq.getDatasetSequence();

412

// first filter in case we are retrieving crossrefs that have already been

413

// retrieved. this happens for cases where a database record doesn't yield

414

// protein products for CDS

415

removeAlreadyRetrievedSeqs(sourceRefs, fromDna);

416

if (sourceRefs.size() == 0)

417

{

418

// no more work to do! We already had all requested sequence records in

// the dataset.

return;

}

try

{

retrieved = sftch.getSequences(sourceRefs, !fromDna);

425

} catch (Exception e)

426

{

427

jalview.bin.Console.errPrintln(

428

"Problem whilst retrieving cross references for Sequence : "

+ seq.getName());

e.printStackTrace();

}

if (retrieved != null)

434

{

435

boolean addedXref = false;

436

List<SequenceI> newDsSeqs = new ArrayList<>(),

437

doNotAdd = new ArrayList<>();

438

439

for (SequenceI retrievedSequence : retrieved)

440

{

441

// dataset gets contaminated ccwith non-ds sequences. why ??!

442

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

443

SequenceI retrievedDss = retrievedSequence

444

.getDatasetSequence() == null ? retrievedSequence

445

: retrievedSequence.getDatasetSequence();

446

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

447

retrievedDss);

448

}

449

// JBPNote: What assumptions are made for dbref structures on

450

// retrieved sequences ?

451

// addedXref will be true means importCrossRefSeq found

452

// sequences with dbrefs with mappings to sequences congruent with dss

if (!addedXref)

{

// try again, after looking for matching IDs

457

// shouldn't need to do this unless the dbref mechanism has broken.

458

updateDbrefMappings(seq, xrfs, retrieved, cf, fromDna);

459

for (SequenceI retrievedSequence : retrieved)

460

{

461

// dataset gets contaminated ccwith non-ds sequences. why ??!

462

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

463

SequenceI retrievedDss = retrievedSequence

464

.getDatasetSequence() == null ? retrievedSequence

465

: retrievedSequence.getDatasetSequence();

466

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

retrievedDss);

}

}

for (SequenceI newToSeq : newDsSeqs)

471

{

472

if (!doNotAdd.contains(newToSeq)

473

&& dataset.findIndex(newToSeq) == -1)

474

{

475

dataset.addSequence(newToSeq);

476

matcher.add(newToSeq);

}

}

}

}

/**

* Search dataset for sequences with a primary reference contained in

* sourceRefs.

* @param sourceRefs

* - list of references to filter.

488

* @param fromDna

489

* - type of sequence to search for matching primary reference.

490

491

private void removeAlreadyRetrievedSeqs(List<DBRefEntry> sourceRefs,

492

boolean fromDna)

493

{

494

List<DBRefEntry> dbrSourceSet = new ArrayList<>(sourceRefs);

495

List<SequenceI> dsSeqs = dataset.getSequences();

496

for (int ids = 0, nds = dsSeqs.size(); ids < nds; ids++)

497

{

498

SequenceI sq = dsSeqs.get(ids);

499

boolean dupeFound = false;

500

// !fromDna means we are looking only for nucleotide sequences, not

501

// protein

502

if (sq.isProtein() == fromDna)

503

{

504

List<DBRefEntry> sqdbrefs = sq.getPrimaryDBRefs();

505

for (int idb = 0, ndb = sqdbrefs.size(); idb < ndb; idb++)

506

{

507

DBRefEntry dbr = sqdbrefs.get(idb);

508

List<DBRefEntry> searchrefs = DBRefUtils.searchRefs(dbrSourceSet,

509

dbr, DBRefUtils.SEARCH_MODE_FULL);

510

for (int isr = 0, nsr = searchrefs.size(); isr < nsr; isr++)

511

{

512

sourceRefs.remove(searchrefs.get(isr));

dupeFound = true;

}

}

}

if (dupeFound)

{

// rebuild the search array from the filtered sourceRefs list

520

dbrSourceSet.clear();

521

dbrSourceSet.addAll(sourceRefs);

}

}

}

/**

* process sequence retrieved via a dbref on source sequence to resolve and

528

* transfer data JBPNote: as of 2022-02-03 - this assumes retrievedSequence

529

* has dbRefs with Mapping references to a sequence congruent with

* sourceSequence

* @param cf

* @param sourceSequence

534

* @param retrievedSequence

535

* @return true if retrieveSequence was imported

536

537

private boolean importCrossRefSeq(AlignedCodonFrame cf,

538

List<SequenceI> newDsSeqs, List<SequenceI> doNotAdd,

539

SequenceI sourceSequence, SequenceI retrievedSequence)

540

{

541

/**

542

* set when retrievedSequence has been verified as a crossreference for

543

* sourceSequence

544

545

boolean imported = false;

546

List<DBRefEntry> dbr = retrievedSequence.getDBRefs();

547

if (dbr != null)

548

{

549

for (int ib = 0, nb = dbr.size(); ib < nb; ib++)

550

{

551

552

DBRefEntry dbref = dbr.get(ib);

553

// matched will return null if the dbref has no map

554

SequenceI matched = findInDataset(dbref);

555

if (matched == sourceSequence)

556

{

557

// verified retrieved and source sequence cross-reference each other

558

imported = true;

559

}

560

// find any entry where we should put in the sequence being

561

// cross-referenced into the map

562

Mapping map = dbref.getMap();

563

if (map != null)

564

{

565

SequenceI ms = map.getTo();

566

if (ms != null && map.getMap() != null)

567

{

568

if (ms == sourceSequence)

569

{

570

// already called to import once, and most likely this sequence

571

// already imported !

continue;

}

if (matched == null)

{

* sequence is new to dataset, so save a reference so it can be added.

newDsSeqs.add(ms);

continue;

}

* there was a matching sequence in dataset, so now, check to see if we can update the map.getTo() sequence to the existing one.

try

{

// compare ms with dss and replace with dss in mapping

590

// if map is congruent

591

// TODO findInDataset requires exact sequence match but

592

// 'congruent' test is only for the mapped part

593

// maybe not a problem in practice since only ENA provide a

594

// mapping and it is to the full protein translation of CDS

595

// matcher.findIdMatch(map.getTo());

596

// TODO addendum: if matched is shorter than getTo, this will fail

597

// - when it should really succeed.

598

int sf = map.getMap().getToLowest();

599

int st = map.getMap().getToHighest();

600

SequenceI mappedrg = ms.getSubSequence(sf, st);

601

if (mappedrg.getLength() > 0 && ms.getSequenceAsString()

602

.equals(matched.getSequenceAsString()))

603

{

604

605

* sequences were a match,

606

607

String msg = "Mapping updated from " + ms.getName()

608

+ " to retrieved crossreference "

609

+ matched.getName();

610

jalview.bin.Console.outPrintln(msg);

611

612

List<DBRefEntry> toRefs = map.getTo().getDBRefs();

if (toRefs != null)

{

* transfer database refs

617

618

for (DBRefEntry ref : toRefs)

619

{

620

if (dbref.getSrcAccString()

621

.equals(ref.getSrcAccString()))

622

{

623

continue; // avoid overwriting the ref on source sequence

624

}

625

matched.addDBRef(ref); // add or update mapping

626

}

627

}

628

doNotAdd.add(map.getTo());

map.setTo(matched);

* give the reverse reference the inverse mapping

633

* (if it doesn't have one already)

634

635

setReverseMapping(matched, dbref, cf);

636

637

638

* copy sequence features as well, avoiding

639

* duplication (e.g. same variation from two

640

* transcripts)

641

642

List<SequenceFeature> sfs = ms.getFeatures()

643

.getAllFeatures();

644

for (SequenceFeature feat : sfs)

645

{

646

647

* make a flyweight feature object which ignores Parent

648

* attribute in equality test; this avoids creating many

649

* otherwise duplicate exon features on genomic sequence

650

651

SequenceFeature newFeature = new SequenceFeature(feat)

652

{

653

@Override

654

public boolean equals(Object o)

655

{

656

return super.equals(o, true);

657

}

658

};

659

matched.addSequenceFeature(newFeature);

660

}

661

}

662

cf.addMap(retrievedSequence, map.getTo(), map.getMap());

663

} catch (Exception e)

664

{

665

jalview.bin.Console.errPrintln(

666

"Exception when consolidating Mapped sequence set...");

667

e.printStackTrace(System.err);

}

}

}

}

}

if (imported)

{

retrievedSequence.updatePDBIds();

676

rseqs.add(retrievedSequence);

677

if (dataset.findIndex(retrievedSequence) == -1)

678

{

679

dataset.addSequence(retrievedSequence);

680

matcher.add(retrievedSequence);

}

}

return imported;

}

/**

* Sets the inverse sequence mapping in the corresponding dbref of the mapped

688

* to sequence (if any). This is used after fetching a cross-referenced

689

* sequence, if the fetched sequence has a mapping to the original sequence,

690

* to set the mapping in the original sequence's dbref.

691

692

* @param mapFrom

693

* the sequence mapped from

* @param dbref

* @param mappings

void setReverseMapping(SequenceI mapFrom, DBRefEntry dbref,

698

AlignedCodonFrame mappings)

699

{

700

SequenceI mapTo = dbref.getMap().getTo();

if (mapTo == null)

{

return;

}

List<DBRefEntry> dbrefs = mapTo.getDBRefs();

if (dbrefs == null)

{

return;

}

for (DBRefEntry toRef : dbrefs)

711

{

712

if (toRef.hasMap() && mapFrom == toRef.getMap().getTo())

713

{

714

715

* found the reverse dbref; update its mapping if null

716

717

if (toRef.getMap().getMap() == null)

718

{

719

MapList inverse = dbref.getMap().getMap().getInverse();

720

toRef.getMap().setMap(inverse);

721

mappings.addMap(mapTo, mapFrom, inverse);

}

}

}

}

/**

* Returns null or the first sequence in the dataset which is identical to

729

* xref.mapTo, and has a) a primary dbref matching xref, or if none found, the

730

* first one with an ID source|xrefacc JBPNote: Could refactor this to

731

* AlignmentI/DatasetI

732

733

* @param xref

734

* with map and mapped-to sequence

735

* @return

736

737

SequenceI findInDataset(DBRefEntry xref)

738

{

739

if (xref == null || !xref.hasMap() || xref.getMap().getTo() == null)

{

return null;

}

SequenceI mapsTo = xref.getMap().getTo();

744

String name = xref.getAccessionId();

745

String name2 = xref.getSource() + "|" + name;

746

SequenceI dss = mapsTo.getDatasetSequence() == null ? mapsTo

747

: mapsTo.getDatasetSequence();

748

// first check ds if ds is directly referenced

749

if (dataset.findIndex(dss) > -1)

{

return dss;

}

DBRefEntry template = new DBRefEntry(xref.getSource(), null,

754

xref.getAccessionId());

755

/**

756

* remember the first ID match - in case we don't find a match to template

757

758

SequenceI firstIdMatch = null;

759

for (SequenceI seq : dataset.getSequences())

760

{

761

// first check primary refs.

762

List<DBRefEntry> match = DBRefUtils.searchRefs(seq.getPrimaryDBRefs(),

763

template, DBRefUtils.SEARCH_MODE_FULL);

764

if (match != null && match.size() == 1 && sameSequence(seq, dss))

{

return seq;

}

* clumsy alternative to using SequenceIdMatcher which currently

770

* returns sequences with a dbref to the matched accession id

771

* which we don't want

772

773

if (firstIdMatch == null && (name.equals(seq.getName())

774

|| seq.getName().startsWith(name2)))

775

{

776

if (sameSequence(seq, dss))

{

firstIdMatch = seq;

}

}

}

return firstIdMatch;

}

/**

* Answers true if seq1 and seq2 contain exactly the same characters (ignoring

787

* case), else false. This method compares the lengths, then each character in

788

* turn, in order to 'fail fast'. For case-sensitive comparison, it would be

789

* possible to use Arrays.equals(seq1.getSequence(), seq2.getSequence()).

* @param seq1

* @param seq2

* @return

// TODO move to Sequence / SequenceI

796

static boolean sameSequence(SequenceI seq1, SequenceI seq2)

{

if (seq1 == seq2)

{

return true;

}

if (seq1 == null || seq2 == null)

{

return false;

}

if (seq1.getLength() != seq2.getLength())

{

return false;

}

int length = seq1.getLength();

812

for (int i = 0; i < length; i++)

813

{

814

int diff = seq1.getCharAt(i) - seq2.getCharAt(i);

815

816

* same char or differ in case only ('a'-'A' == 32)

817

818

if (diff != 0 && diff != 32 && diff != -32)

{

return false;

}

}

return true;

}

/**

* Updates any empty mappings in the cross-references with one to a compatible

828

* retrieved sequence if found, and adds any new mappings to the

829

* AlignedCodonFrame JBPNote: TODO: this relies on sequence IDs like

830

* UNIPROT|ACCESSION - which do not always happen.

* @param mapFrom

* @param xrefs

* @param retrieved

* @param acf

void updateDbrefMappings(SequenceI mapFrom, List<DBRefEntry> xrefs,

838

SequenceI[] retrieved, AlignedCodonFrame acf, boolean fromDna)

839

{

840

SequenceIdMatcher idMatcher = new SequenceIdMatcher(retrieved);

841

for (DBRefEntry xref : xrefs)

{

if (!xref.hasMap())

{

String targetSeqName = xref.getSource() + "|"

846

+ xref.getAccessionId();

847

SequenceI[] matches = idMatcher.findAllIdMatches(targetSeqName);

if (matches == null)

{

return;

}

for (SequenceI seq : matches)

853

{

854

constructMapping(mapFrom, seq, xref, acf, fromDna);

}

}

}

}

/**

* Tries to make a mapping between sequences. If successful, adds the mapping

862

* to the dbref and the mappings collection and answers true, otherwise

863

* answers false. The following methods of making are mapping are tried in

864

* turn:

865

* <ul>

866

* <li>if 'mapTo' holds a mapping to 'mapFrom', take the inverse; this is, for

867

* example, the case after fetching EMBL cross-references for a Uniprot

868

* sequence</li>

869

* <li>else check if the dna translates exactly to the protein (give or take

870

* start and stop codons></li>

871

* <li>else try to map based on CDS features on the dna sequence</li>

* </ul>

* @param mapFrom

* @param mapTo

* @param xref

* @param mappings

* @return

boolean constructMapping(SequenceI mapFrom, SequenceI mapTo,

881

DBRefEntry xref, AlignedCodonFrame mappings, boolean fromDna)

882

{

883

MapList mapping = null;

884

SequenceI dsmapFrom = mapFrom.getDatasetSequence() == null ? mapFrom

885

: mapFrom.getDatasetSequence();

886

SequenceI dsmapTo = mapTo.getDatasetSequence() == null ? mapTo

887

: mapTo.getDatasetSequence();

888

889

* look for a reverse mapping, if found make its inverse.

890

* Note - we do this on dataset sequences only.

891

892

if (dsmapTo.getDBRefs() != null)

893

{

894

for (DBRefEntry dbref : dsmapTo.getDBRefs())

895

{

896

String name = dbref.getSource() + "|" + dbref.getAccessionId();

897

if (dbref.hasMap() && dsmapFrom.getName().startsWith(name))

898

{

899

900

* looks like we've found a map from 'mapTo' to 'mapFrom'

901

* - invert it to make the mapping the other way

902

903

MapList reverse = dbref.getMap().getMap().getInverse();

904

xref.setMap(new Mapping(dsmapTo, reverse));

905

mappings.addMap(mapFrom, dsmapTo, reverse);

return true;

}

}

}

if (fromDna)

{

mapping = AlignmentUtils.mapCdnaToProtein(mapTo, mapFrom);

}

else

{

mapping = AlignmentUtils.mapCdnaToProtein(mapFrom, mapTo);

918

if (mapping != null)

919

{

920

mapping = mapping.getInverse();

}

}

if (mapping == null)

{

return false;

}

xref.setMap(new Mapping(mapTo, mapping));

928

929

930

* and add a reverse DbRef with the inverse mapping

931

932

if (mapFrom.getDatasetSequence() != null && false)

933

// && mapFrom.getDatasetSequence().getSourceDBRef() != null)

934

{

935

// possible need to search primary references... except, why doesn't xref

936

// == getSourceDBRef ??

937

// DBRefEntry dbref = new DBRefEntry(mapFrom.getDatasetSequence()

938

// .getSourceDBRef());

939

// dbref.setMap(new Mapping(mapFrom.getDatasetSequence(), mapping

940

// .getInverse()));

941

// mapTo.addDBRef(dbref);

}

if (fromDna)

{

// AlignmentUtils.computeProteinFeatures(mapFrom, mapTo, mapping);

947

mappings.addMap(mapFrom, mapTo, mapping);

}

else

{

mappings.addMap(mapTo, mapFrom, mapping.getInverse());

}

return true;

}

/**

* find references to lrfs in the cross-reference set of each sequence in

959

* dataset (that is not equal to sequenceI) Identifies matching DBRefEntry

960

* based on source and accession string only - Map and Version are nulled.

961

962

* @param fromDna

963

* - true if context was searching from Dna sequences, false if

964

* context was searching from Protein sequences

* @param sequenceI

* @param lrfs

* @param foundSeqs

* @return true if matches were found.

969

970

6702

private boolean searchDatasetXrefs(boolean fromDna, SequenceI sequenceI,

971

List<DBRefEntry> lrfs, List<SequenceI> foundSeqs,

972

AlignedCodonFrame cf)

973

{

974

6702

boolean found = false;

975

6702

if (lrfs == null)

976

{

977

4981

return false;

978

}

979

3659

for (int i = 0, n = lrfs.size(); i < n; i++)

980

{

981

// DBRefEntry xref = new DBRefEntry(lrfs.get(i));

982

// // add in wildcards

983

// xref.setVersion(null);

984

// xref.setMap(null);

985

1938

found |= searchDataset(fromDna, sequenceI, lrfs.get(i), foundSeqs, cf,

986

false, DBRefUtils.SEARCH_MODE_NO_MAP_NO_VERSION);

987

}

988

1721

return found;

}

/**

* Searches dataset for DBRefEntrys matching the given one (xrf) and adds the

993

* associated sequence to rseqs

994

995

* @param fromDna

996

* true if context was searching for refs *from* dna sequence, false

997

* if context was searching for refs *from* protein sequence

998

* @param fromSeq

999

* a sequence to ignore (start point of search)

1000

* @param xrf

1001

* a cross-reference to try to match

1002

* @param foundSeqs

1003

* result list to add to

1004

* @param mappings

1005

* a set of sequence mappings to add to

1006

* @param direct

1007

* - indicates the type of relationship between returned sequences,

1008

* xrf, and sequenceI that is required.

1009

* <ul>

1010

* <li>direct implies xrf is a primary reference for sequenceI AND

1011

* the sequences to be located (eg a uniprot ID for a protein

1012

* sequence, and a uniprot ref on a transcript sequence).</li>

1013

* <li>indirect means xrf is a cross reference with respect to

1014

* sequenceI or all the returned sequences (eg a genomic reference

1015

* associated with a locus and one or more transcripts)</li>

1016

* </ul>

1017

* @param mode

1018

* SEARCH_MODE_FULL for all; SEARCH_MODE_NO_MAP_NO_VERSION optional

1019

* @return true if relationship found and sequence added.

1020

1021

1963

boolean searchDataset(boolean fromDna, SequenceI fromSeq, DBRefEntry xrf,

1022

List<SequenceI> foundSeqs, AlignedCodonFrame mappings,

1023

boolean direct, int mode)

1024

{

1025

1963

boolean found = false;

1026

1963

if (dataset == null)

{

return false;

}

1963

if (dataset.getSequences() == null)

1031

{

1032

jalview.bin.Console

1033

.errPrintln("Empty dataset sequence set - NO VECTOR");

1034

return false;

1035

}

1036

1963

List<SequenceI> ds = dataset.getSequences();

1037

1963

synchronized (ds)

1038

{

1039

1963

for (SequenceI nxt : ds)

1040

{

1041

43625

if (nxt != null)

1042

{

1043

43625

if (nxt.getDatasetSequence() != null)

1044

{

1045

jalview.bin.Console.errPrintln(

1046

"Implementation warning: CrossRef initialised with a dataset alignment with non-dataset sequences in it! ("

1047

+ nxt.getDisplayId(true) + " has ds reference "

1048

+ nxt.getDatasetSequence().getDisplayId(true)

1049

+ ")");

1050

}

1051

43625

if (nxt == fromSeq || nxt == fromSeq.getDatasetSequence())

1052

{

1053

1960

continue;

1054

}

1055

1056

* only look at same molecule type if 'direct', or

1057

* complementary type if !direct

1058

1059

{

1060

41665

boolean isDna = !nxt.isProtein();

1061

41665

if (direct ? (isDna != fromDna) : (isDna == fromDna))

1062

{

1063

// skip this sequence because it is wrong molecule type

1064

36622

continue;

}

}

// look for direct or indirect references in common

1069

5043

List<DBRefEntry> poss = nxt.getDBRefs();

1070

5043

List<DBRefEntry> cands = null;

1071

1072

// todo: indirect specifies we select either direct references to nxt

1073

// that match xrf which is indirect to sequenceI, or indirect

1074

// references to nxt that match xrf which is direct to sequenceI

1075

5043

cands = DBRefUtils.searchRefs(poss, xrf, mode);

1076

// else

1077

// {

1078

// poss = DBRefUtils.selectDbRefs(nxt.isProtein()!fromDna, poss);

1079

// cands = DBRefUtils.searchRefs(poss, xrf);

1080

// }

1081

5043

if (!cands.isEmpty())

1082

{

1083

880

if (foundSeqs.contains(nxt))

1084

{

1085

582

continue;

1086

}

1087

298

found = true;

1088

298

foundSeqs.add(nxt);

1089

298

if (mappings != null && !direct)

1090

{

1091

1092

* if the matched sequence has mapped dbrefs to

1093

* protein product / cdna, add equivalent mappings to

1094

* our source sequence

1095

1096

for (DBRefEntry candidate : cands)

1097

{

1098

Mapping mapping = candidate.getMap();

1099

if (mapping != null)

1100

{

1101

MapList map = mapping.getMap();

1102

if (mapping.getTo() != null

1103

&& map.getFromRatio() != map.getToRatio())

1104

{

1105

1106

* add a mapping, as from dna to peptide sequence

1107

1108

if (map.getFromRatio() == 3)

1109

{

1110

mappings.addMap(nxt, fromSeq, map);

}

else

{

mappings.addMap(nxt, fromSeq, map.getInverse());

}

}

}

}

}

}

}

}

}

1963

return found;

1125

}

1126

}

Coverage Report

File CrossRef.java

Coverage histogram

Code metrics

Classes

Class CrossRef

Contributing tests

Contributing tests

Source view